<html><head><meta http-equiv="Content-Type" content="text/html charset=koi8-r"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><br><div><div>28.10.2012, Χ 12:25, Ami Fischman &lt;<a href="mailto:fischman@chromium.org">fischman@chromium.org</a>&gt; ΞΑΠΙΣΑΜ(Α):</div><blockquote type="cite"><div class="gmail_extra"><div class="gmail_quote"><div><br></div><div>To make concrete the cost/benefit tradeoff, would you add a random sleep() into DRT execution to detect timing-related bugs?</div>
<div>It seems like a crazy thing to do, to me, but it would certainly catch timing-related bugs quite effectively.&nbsp;</div><div>If you don't think we should do that, can you describe how you're evaluating cost/benefit in each of the cases and why you arrive at different conclusions?</div></div></div></blockquote><div><br></div><div>A huge difference between this idea and caches is that caches are deterministic - when you run the same set of tests over and over, you get the same behavior. So, you can find a small subset of tests that trigger a bug, or add logging that records state changes, and you can fix a bug in WebCore.</div><div><br></div><blockquote type="cite"><div class="gmail_extra"><div class="gmail_quote"><div>Of course. &nbsp;But we should at least make it humanly possible to understand our tests as written :)</div><div>Making understanding our tests not humanly possible isn't the way to make up for the not-humanly-possible nature of testing everything in every way.</div>
<div>It just means we push off not knowing how much coverage we really have, and derive a false sense of security from the fact that bugs have been found in the past.</div></div></div></blockquote><div><br></div><div>I think that you are hugely overstating this. Adding a random query to a URL does not make a test incomprehensible.</div><div><br></div><div>Let me offer you another angle to look at this. As you said, ability to reason about tests is a priority. But reasoning does not include looking at test results alone. One needs to reason about tests in other cases, too:</div><div><br></div><div>- running a test in browser to update and/or debug it (e.g. when spec changes);</div><div>- sending a test to developers of another browser as part of a bug report.</div><div><br></div><div>If we have tests that strongly depend on tricks inside WebKitTestRunner, this becomes virtually impossible. You just reload the test in browser, or open it in two tabs, or load it after some other test, and it magically changes results.</div><div><br></div><div>A good test is usable in the aforementioned scenarios, and thus does not need special tricks in WebKitTestRunner.</div><br><blockquote type="cite"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-color: rgb(204, 204, 204); border-left-style: solid; padding-left: 1ex; position: static; z-index: auto; ">
<div style="word-wrap:break-word">I completely agree with Maciej's idea that we should think about ways to make non-deterministic failures easier to work with, so that they would lead to discovering the root cause more directly, and without the costs currently associated with it.<br>
</div></blockquote><div><br></div><div>I have no problem with that, but I'm not sure how it relates to this thread unless one takes an XOR approach, in which case I guess I have low faith that the bigger problem Maciej highlights will be solved in a reasonable timeframe (weeks/months).</div></div></div></blockquote><div><br></div><div>We have all the time in the world. There is no pressing problem that must be solved in months.</div><br><blockquote type="cite"><div class="gmail_extra"><div class="gmail_quote">
<blockquote class="gmail_quote" style="margin: 0px 0px 0px 0.8ex; border-left-width: 1px; border-left-color: rgb(204, 204, 204); border-left-style: solid; padding-left: 1ex; position: static; z-index: auto; "><div style="word-wrap:break-word"><div><blockquote type="cite">
<div bgcolor="#FFFFFF" text="#000000"><div class="im"><blockquote type="cite"><div>Memory allocator state. Computer's real time clock. Hard drive's head position if you have a spinning hard drive, or SSD controller state if you have an SSD. HTTP cookies. Should I continue the list?</div>
</blockquote></div><div class="im"><span style="">These things are all outside of webkit.</span></div></div></blockquote></div><div bgcolor="#FFFFFF" text="#000000"><span style="">Yes, they are outside WebKit, but not outside WebKit control, if needed.</span></div>
<div bgcolor="#FFFFFF" text="#000000"><span style="">Did you intend that to be an objection?</span></div></div></blockquote><div><br></div><div>I imagine&nbsp;<span style="font-family:arial,sans-serif;font-size:13px">Balazs&nbsp;</span>was pointing out that you included items that are not JS-visible in an answer to my question about things that are JS-visible. &nbsp;But that was part of an earlier fork of this thread that went nowhere, so let's let it go.</div></div></div></blockquote><div><br></div><div>All these things are visible in that they can directly affect tests. Memory layout affects how you write tests for certain crashers, and the rest affects performance tests (we attempted to have regression tests for fixes that change asymptotic complexity of algorithms, and they were very flaky).</div><br><div>
<div>- WBR, Alexey Proskuryakov</div>

</div>
<div><br></div></div></body></html>