<br><br><div class="gmail_quote">On Thu, Nov 20, 2008 at 12:01 AM, Jungshik Shin (, ) <span dir="ltr">&lt;<a href="mailto:jungshik@google.com">jungshik@google.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<br><br><div class="gmail_quote">2008/11/6 Prunthaban Kanthakumar <span dir="ltr">&lt;<a href="mailto:prunthaban@google.com" target="_blank">prunthaban@google.com</a>&gt;</span><div><div></div><div class="Wj3C7c"><br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">

Hi All,<br><br>This is a continuation of the mail thread <a href="https://lists.webkit.org/pipermail/webkit-dev/2008-October/005495.html" target="_blank">https://lists.webkit.org/pipermail/webkit-dev/2008-October/005495.html</a><br>

<br>I am interested in discussing about some of the ways to implement mjs&#39; ideas.<br>
<br>As mjs says in the above mail, <br><br><i>In case you look into implementing this, what I&#39;d suggest is an extra CSS property that can be set based the font property at style resolution time. (since I think the computed font list will strip EOT fonts, so it might be too late to look at it once you are on the rendering side). Something like -webkit-indic-text-decode. </i><br>


<br>When the code reaches RenderText::styleDidChange method, the font information will still remain in the RenderStyle object associated with the RenderText (because this happens at the time of parsing the html file, well before font resolution happens).&nbsp; Now in this method, there is check to see if there are text-transformations as part of the style and if there is one, then the method setText is called, forcing it to modify the &#39;internal text&#39; if needed.<br>


<br>Now we can do the following,<br>1. Add an additional condition in styleDidChange method to check if the font-family is supported by our transcoder (At present a fast look-up table should do because we plan to support only limited set of fonts)&nbsp; - This condition will be #ifdefed on ENABLE(TRANSCODER_SUPPORT).<br>


2. Now in the setTextInternal method, based on the font-family, we get the corresponding transcoder (probably from a map) and perform the transcoding.<br><br>Later when font-resolution happens, since the particular font is eot, it will be ignored and based on the code point of glyphs a default font will be choosen by Webkit and hence the correct characters will appear on the screen. <br>


Also after setTextInternal method there is a layout &amp; width recalculation done which is important for us because we modify the characters. So RenderText::setTextInternal method seems to be the ideal place to plug-in the transcoder.<br>


<br>On a related note, I would like to mention here that, we cannot go with the approach of &#39;one look-up table&#39; per font-face and a single transcoder to do the look-up for all fonts. The problem is that many indic languages use multiple code-points to represent one character and different fonts use different standards! For example there are situations where one glyph in EOT needs to be transcoded to 5+ Unicode code points. A reverse situation is also possible. Due to these issues, we cannot go with a simple look-up table for all fonts. This forces us to write some specialized code to handle each font (there might also be some fonts where a one-to-one look-up table will be enough).</blockquote>

</div></div><div><br><br>In October, I listed two alternatives for this transformation. One is adding ICU converters for Indic font encodings (it can deal with m-to-n mappings) and the other is implementing your own. The first was ruled out because it&#39;s not easy to add new converters on Mac OS X where ICU is a part of the OS. &nbsp; There&#39;s another approach you can take. You can build ICU transliterator rules and it seems to be the cleanest way to do this. You don&#39;t need to port/implement conversion code (from another project : e.g. Padma) but just need to &#39;port&#39; the conversion tables to ICU transliterator rules. <br>

<br>This transcoding will be invoked on the content of a text node already in Unicode just like &#39;text-transform: capitalize&#39; or &#39;text-transform: lowercase&#39; is.&nbsp; ICU transformer is for transforming a chunk of text in Unicode to another chunk of text in Unicode. <br>

( <a href="http://www.icu-project.org/userguide/Transform.html" target="_blank">http://www.icu-project.org/userguide/Transform.html</a> ) So, it appears to be almost a perfect fit. </div></div></blockquote><div><br>I do not have much knowledge about ICU Transformers. But from the link above what I understand is, transformers are to perform &#39;transliteration&#39; like converting from English to Hindi. I am not sure how this can be used to transcode indic fonts. (ICU Converters are the ones which do transcoding from one script to another. But from what you have said, it looks like ICU converters are not the way to go). <br>
<br>Also what we are trying to do is to transcode characters which are actually in the ASCII range (whose glyphs are &quot;hacked&quot; by font designers to render indic characters) to unicode characters of the corresponding language. So to what extent a transfomer is going to be helpful to us? In our case each font (or in some cases a set of fonts due to some standardization efforts in the past) will have its own mapping of ASCII-Unicode (which are m-to-n) and the purpose of ICU transformers seem to be different from this. <br>
&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="gmail_quote"><div><br><font color="#888888"><br>Jungshik<br></font><br>P.S. BTW, I filed <a href="https://bugs.webkit.org/show_bug.cgi?id=22339" target="_blank">https://bugs.webkit.org/show_bug.cgi?id=22339</a> for this task.<br>

If you haven&#39;t filed one, why don&#39;t you use 22339 for uploading a prototype patch for one (site, font) pair as Brett suggested? </div></div></blockquote><div><br>Thanks. I will use that. Once we decide upon the approach, I will go ahead with implementing it and submit a patch in the bug id you created.<br>
&nbsp;</div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="gmail_quote"><div><br><br><br>&nbsp;<br></div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">
<div class="Ih2E3d">
<br>
<br>I would like to hear from you about this. Is this approach fine or do you have any issues or suggestions?<br><br>Regards,<br><font color="#888888">Prunthaban<br><br>
</font><br></div><div class="Ih2E3d">_______________________________________________<br>
webkit-dev mailing list<br>
<a href="mailto:webkit-dev@lists.webkit.org" target="_blank">webkit-dev@lists.webkit.org</a><br>
<a href="http://lists.webkit.org/mailman/listinfo.cgi/webkit-dev" target="_blank">http://lists.webkit.org/mailman/listinfo.cgi/webkit-dev</a><br>
<br></div></blockquote></div><br>
</blockquote></div><br>