<html>
    <head>
      <base href="https://bugs.webkit.org/" />
    </head>
    <body><span class="vcard"><a class="email" href="mailto:mcatanzaro&#64;igalia.com" title="Michael Catanzaro &lt;mcatanzaro&#64;igalia.com&gt;"> <span class="fn">Michael Catanzaro</span></a>
</span> changed
              <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - [GTK] Spellchecker rejects word when adding a period character if there is no trailing space before the next word"
   href="https://bugs.webkit.org/show_bug.cgi?id=149056">bug 149056</a>
        <br>
             <table border="1" cellspacing="0" cellpadding="8">
          <tr>
            <th>What</th>
            <th>Removed</th>
            <th>Added</th>
          </tr>

         <tr>
           <td style="text-align:right;">URL</td>
           <td>
               &nbsp;
           </td>
           <td>http://userguide.icu-project.org/boundaryanalysis
           </td>
         </tr></table>
      <p>
        <div>
            <b><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - [GTK] Spellchecker rejects word when adding a period character if there is no trailing space before the next word"
   href="https://bugs.webkit.org/show_bug.cgi?id=149056#c11">Comment # 11</a>
              on <a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - [GTK] Spellchecker rejects word when adding a period character if there is no trailing space before the next word"
   href="https://bugs.webkit.org/show_bug.cgi?id=149056">bug 149056</a>
              from <span class="vcard"><a class="email" href="mailto:mcatanzaro&#64;igalia.com" title="Michael Catanzaro &lt;mcatanzaro&#64;igalia.com&gt;"> <span class="fn">Michael Catanzaro</span></a>
</span></b>
        <pre>(In reply to <a href="show_bug.cgi?id=149056#c10">comment #10</a>)
<span class="quote">&gt; wordBreakIterator seems to be pretty smart actually: not breaking on every
&gt; punctuation mark seems to make sense in some languages as the punctuation
&gt; marks can be considered part of the word itself (kind of as a word
&gt; construction mechanism).</span >

It doesn't seem smart to me, if it's not actually able to detect word breaks properly. A punctuation mark might occur inside a word in some languages, but if it's followed by a space, then surely it is always a word break character? I haven't looked at this closely, but I suspect we are somehow misusing the ICU API, as I'd like to think it's smart enough to handle this. At least, detecting word breaks properly is a standard feature of GtkTextIter, so I would expect ICU to be able to do it as well. If we can't figure it out, might need to look at what GtkTextIter is doing.

<span class="quote">&gt; That being said, this creates bugs when checking the spelling of sentences
&gt; with a poor syntax (like ones with no space after a period or a colon), but
&gt; this is a spell checking bug, not a word breaking one.</span >

In that case, I would expect the spellchecker to flag the word foo.bar as misspelled.</pre>
        </div>
      </p>
      <hr>
      <span>You are receiving this mail because:</span>
      
      <ul>
          <li>You are the assignee for the bug.</li>
      </ul>
    </body>
</html>