I&#39;m not an expert on Pixel tests, but my understanding is that in Chromium (where we&#39;ve always run with tolerance 0) we&#39;ve seen real regressions that would have slipped by with something like tolerance 0.1.  When you have 0 tolerance, it is more maintenance work, but if we can avoid regressions, it seems worth it.<div>

<br></div><div>J<br><br><div class="gmail_quote">On Fri, Oct 8, 2010 at 10:58 AM, Nikolas Zimmermann <span dir="ltr">&lt;<a href="mailto:zimmermann@physik.rwth-aachen.de">zimmermann@physik.rwth-aachen.de</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><br>
Am 08.10.2010 um 19:53 schrieb Maciej Stachowiak:<div class="im"><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
On Oct 8, 2010, at 12:46 AM, Nikolas Zimmermann wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Am 08.10.2010 um 00:44 schrieb Maciej Stachowiak:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
On Oct 7, 2010, at 6:34 AM, Nikolas Zimmermann wrote:<br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Good evening webkit folks,<br>
<br>
I&#39;ve finished landing svg/ pixel test baselines, which pass with --tolerance 0 on my 10.5 &amp; 10.6 machines.<br>
As the pixel testing is very important for the SVG tests, I&#39;d like to run them on the bots, experimentally, so we can catch regressions easily.<br>
<br>
Maybe someone with direct access to the leopard &amp; snow leopard bots, could just run &quot;run-webkit-tests --tolerance 0 -p svg&quot; and mail me the results?<br>
If it passes, we could maybe run the pixel tests for the svg/ subdirectory on these bots?<br>
</blockquote>
<br>
Running pixel tests would be great, but can we really expect the results to be stable cross-platform with tolerance 0? Perhaps we should start with a higher tolerance level.<br>
</blockquote>
<br>
Sure, we could do that. But I&#39;d really like to get a feeling, for what&#39;s problematic first. If we see 95% of the SVG tests pass with --tolerance 0, and only a few need higher tolerances<br>
(64bit vs. 32bit aa differences, etc.), I could come up with a per-file pixel test tolerance extension to DRT, if it&#39;s needed.<br>
<br>
How about starting with just one build slave (say. Mac Leopard) that runs the pixel tests for SVG, with --tolerance 0 for a while. I&#39;d be happy to identify the problems, and see<br>
if we can make it work, somehow :-)<br>
</blockquote>
<br>
The problem I worry about is that on future Mac OS X releases, rendering of shapes may change in some tiny way that is not visible but enough to cause failures at tolerance 0. In the past, such false positives arose from time to time, which is one reason we added pixel test tolerance in the first place. I don&#39;t think running pixel tests on just one build slave will help us understand that risk.<br>


</blockquote>
<br></div>
I think we&#39;d just update the baseline to the newer OS X release, then, like it has been done for the tiger -&gt; leopard, leopard -&gt; snow leopard switch?<br>
platform/mac/ should always contain the newest release baseline, when therere are differences on leopard, the results go into platform/mac-leopard/<div class="im"><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Why not start with some low but non-zero tolerance (0.1?) and see if we can at least make that work consistently, before we try the bolder step of tolerance 0?<br>
Also, and as a side note, we probably need to add more build slaves to run pixel tests at all, since just running the test suite without pixel tests is already slow enough that the testers are often significantly behind the builders.<br>


</blockquote>
<br></div>
Well, I thought about just running the pixel tests for the svg/ subdirectory as a seperate step, hence my request for tolerance 0, as the baseline passes without problems at least on my &amp; Dirks machine already.<br>
I wouldnt&#39; want to argue running 20.000+ pixel tests with tolerance 0 as first step :-) But the 1000 SVG tests, might be fine, with tolerance 0?<br>
<br>
Even tolerance 0.1 as default for SVG would be fine with me, as long as we can get the bots to run the SVG pixel tests :-)<br>
<br>
Cheers,<br>
Niko<div><div></div><div class="h5"><br>
<br>
_______________________________________________<br>
webkit-dev mailing list<br>
<a href="mailto:webkit-dev@lists.webkit.org" target="_blank">webkit-dev@lists.webkit.org</a><br>
<a href="http://lists.webkit.org/mailman/listinfo.cgi/webkit-dev" target="_blank">http://lists.webkit.org/mailman/listinfo.cgi/webkit-dev</a><br>
</div></div></blockquote></div><br></div>