Re: NSLinguisticTagger
Re: NSLinguisticTagger
- Subject: Re: NSLinguisticTagger
- From: "Gerriet M. Denkmann" <email@hidden>
- Date: Thu, 25 Sep 2014 11:36:41 +0700
On 24 Sep 2014, at 23:57, 2551 <email@hidden> wrote:
> That's correct behaviour. There is no such word as เหลือง in Thai. It's a particle that always exists as an adjunct to something else. Although สี is a word on its own, เหลือง is not. Even when Thais speakers say something like รถเหลือง, this is colloquial speech. Technically, it's รถสีเหลือง.
1. "yellow" is an adjective in the English language. It always occurs together with a noun, like "yellow bicycle" or "yellow shirt". Does this imply that "yellow" is not a word?
2. If one defines "word" as: "something which is written in bold face in a respectable dictionary", then both "สี" and "เหลือง" are words, whereas "สีเหลือง" is not.
เหลือง: ว. สีอย่างสีรงทองหรือขมิ้น. (from: พจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๕๔).
3. Do you mean that "เหลือง" in proper Thai is always preceded by "สี" ?
ผ้าเช็ดปาก น. ผ้าแดงหรือผ้าแดงสลับเหลืองเป็นตา ๆ ...
... สีเขียวอมเหลือง ...
4. What about other non-words reported by CFStringTokenizer, NSStringEnumerationByWords or NSLinguisticTagger in iOS 8 or Mac OS X 10.10 as "words" like:
ก็มี, ในเรื่อง, ของฉัน (but ของคุณ = two words), เนื้อสัตว์ (but เนื้อมนุษย์ = two words) ?
Why is "ความคล่องแคล่ว" one word, whereas "ความกระฉับกระเฉง" two?
Why is "การกรอง" one word, whereas "การกร่อน" two?
The only way to make any sense of the new behaviour of these routines is to redefine "word" as: "sequence of arbitrary things which quite often occur together".
Not really a very scholarly definition.
Kind regards,
Gerriet.
_______________________________________________
Cocoa-dev mailing list (email@hidden)
Please do not post admin requests or moderator comments to the list.
Contact the moderators at cocoa-dev-admins(at)lists.apple.com
Help/Unsubscribe/Update your Subscription:
This email sent to email@hidden