<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">I just saw that when looking at the code by myself.<div>What do you&nbsp;exactly&nbsp;mean by a prefix tree?</div><div><div><br></div><div>I also noticed that the entity parser does not take into account combined Unicode characters&nbsp;(see §A.3 in: <a href="http://www.w3.org/TR/xml-entity-names/">http://www.w3.org/TR/xml-entity-names/</a>).</div><div>In addition, even without entities, combined characters are displayed as separate ones.</div><div><br></div><div>François Sausset</div><div>&nbsp;</div><div><br><div><div>Le 10 juil. 2010 à 21:00, Adam Barth a écrit :</div><br class="Apple-interchange-newline"><blockquote type="cite"><span class="Apple-style-span" style="border-collapse: separate; font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; ">Implementing MathML entities is not as easy as adding them to<br>HTMLEntityNames.gperf. &nbsp;The problem is our entity parsing code (both<br>the legacy entity parser and thew new HTML5 one we're using) assumes<br>that all named entities are &lt;= 8 characters:<br><br><a href="http://trac.webkit.org/browser/trunk/WebCore/html/HTMLEntityParser.cpp#L194">http://trac.webkit.org/browser/trunk/WebCore/html/HTMLEntityParser.cpp#L194</a><br><br>Rather than just bumping up that number, we need to change the data<br>structure we use to store entities. &nbsp;Instead of a perfect hash, we<br>should use a prefix tree. &nbsp;In order to parse entities correctly<br>according to the spec, we need to know whether a given string is a<br>prefix of a named entity, which is what the prefix tree would tell us.<br><br>Adam</span></blockquote></div><br></div></div></body></html>