<html><head><meta http-equiv="Content-Type" content="text/html charset=windows-1252"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;"><div>Sorry Jose.</div><div>&nbsp;I just re-read my e-mail and it was incomprensible, my bad.&nbsp;</div><div>let me&nbsp;<span style="background-color: rgb(250, 250, 250); font-family: Verdana, Arial, Tahoma, Calibri, Geneva, sans-serif; font-size: 13px; line-height: 15px;">paraphrase myself again.</span></div><div><span style="background-color: rgb(250, 250, 250); font-family: Verdana, Arial, Tahoma, Calibri, Geneva, sans-serif; font-size: 13px; line-height: 15px;"><br></span></div><div><span style="background-color: rgb(250, 250, 250); font-family: Verdana, Arial, Tahoma, Calibri, Geneva, sans-serif; font-size: 13px; line-height: 15px;"><br></span></div><div><span style="background-color: rgb(250, 250, 250);"><font face="Verdana, Arial, Tahoma, Calibri, Geneva, sans-serif" size="2"><span style="line-height: 15px;">1)Got the actual data for all the resources&nbsp;been downloaded its a bit tricky. in our case we use&nbsp;</span></font></span>webkit_get_default_session() to access the soup main session and attach a "request-queued” event into it so for each element downloaded you could access the soup-message, and for each soup-message you can attach "got-chunk” so every piece of data is send to that event and you need to manually store it to get its length and contents- &nbsp;sadly this events was removed in libsoup 2.39.4 if I remember well. but thanks that its open source I patched that feature back (ugly but I was desperate) if you want i cane send you that patch , its works in the latest version of lib soup used by webkitgtk and webkit2gtk.</div><div>Sadly there is no element in the api to get or catch the frames that are created in a webpage, the guys here told me to file a bug asking for this feature in webkit2gtk but in the old API is present via the signal “frame-created” over a web_view or frame. I think i will file that bug because i need that functionality but im still working with the old API.</div><div><br></div><div><br></div>2) the method and patch described in point 1 also works for all the elements that pass throughout the browser so all the elementos downloaded by the flash and the fly itself can be obtained :)<div><br></div><div>3) how are you capturing these screenshots? We do screenshots accessing Cairo but our tool make sure that the page is full loaded, also found that some pages just crash the xlib if the page is too heavy and you don’t use a scrollview to contain it. please, tell me more details about this issue.<br><div apple-content-edited="true"><br></div><div apple-content-edited="true"><br></div><div apple-content-edited="true"><br></div><div apple-content-edited="true">I hope this help</div>
<br><div><div>El 27-08-2014, a las 13:02, Jose &lt;<a href="mailto:jmalv04@gmail.com">jmalv04@gmail.com</a>&gt; escribió:</div><br class="Apple-interchange-newline"><blockquote type="cite">In a previous discussion<br><a href="https://lists.webkit.org/pipermail/webkit-gtk/2012-February/000960.html">https://lists.webkit.org/pipermail/webkit-gtk/2012-February/000960.html</a><br><br>the webkit_web_view_save_to_dir was proposed.<br><br>What ended up being implemented was webkit_web_view_save and<br>_save_to_file, which dump the webview using<br>the MHTML format.<br><br>I thought it would be useful for my understanding to dump each<br>resource to a file, so I basically<br>follow the approach described in the testing files<br><br>- connect to resource-load-started<br>- Connect to loaded signal and add each resource to a GLIst<br>- wait some time after the page has loaded<br>- take a snapshot<br>- save the resource and subresources to a directory<br><br>This works well for most web pages but I have 3 cases I don't know how<br>to handle (using 2.5.3):<br><br>1) The page has frames<br><br>E.g. when I Ioad a URL with this content<br><br>&lt;html&gt;<br>&lt;frameset cols="10%,10%,80%"&gt;<br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;frame src="data:text/html,ok" /&gt;<br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;frame src="/doesnotexist.html" /&gt;<br> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;frame src="/test/index2.html" /&gt;<br>&lt;/frameset&gt;<br>&lt;/html&gt;<br><br>I get the following (status code, type, url, get_content_len, actual dataSize)<br><br>200 html /test/frames_broken.html 202 202<br>200 html /test/index2.html 41 0<br>404 html /doesnotexist.html 168 0<br>0 html data:text/html,ok 2 0<br><br>The main_resource and the data URI are ok but I am unable to get the<br>content for the other two frames (and I think at least I should get<br>the 41 bytes content from /test/index2.html, as it has status 200)<br><br><br>2) The page loads a Flash plugin<br><br>I would need to save the file that is being passed to the plugin (and<br>maybe a reference to which plugin, which may be obvious from the<br>extension). The plugin content file does not show as a Resource.<br><br><br>3) Debugging a large page<br><br>I've taken snapshots of several large pages and they render properly.<br>When I try a full page rendering of http://www.yahoo.es, there are some images<br> missing (happens for short and long waits after load<br>but does not happen when the rendering is limited in height).<br><br>Anecdotally, I verified that these final images load slowly in<br>Epiphany 3.10 (but not so much in the 2.5.3 MiniBrowser) and<br>they load much faster in Firefox.<br><br>And when I look at the resources, the images not in the snapshot are<br>missing but I don't get any non-200 status code or failed callback.<br><br><br>Any ideas on how to approach these three issues ?<br><br>thanks<br>_______________________________________________<br>webkit-gtk mailing list<br>webkit-gtk@lists.webkit.org<br>https://lists.webkit.org/mailman/listinfo/webkit-gtk<br></blockquote></div><br></div></body></html>