Index: icu46/source/data/translit/Latin_Katakana.txt |
=================================================================== |
--- icu46/source/data/translit/Latin_Katakana.txt (revision 0) |
+++ icu46/source/data/translit/Latin_Katakana.txt (revision 0) |
@@ -0,0 +1,275 @@ |
+# *************************************************************************** |
+# * |
+# * Copyright (C) 2004-2010, International Business Machines |
+# * Corporation; Unicode, Inc.; and others. All Rights Reserved. |
+# * |
+# *************************************************************************** |
+# File: Latin_Katakana.txt |
+# Generated from CLDR |
+# |
+:: [[ᄀ-ᄒᄚᄡ\u1160-ᅵᆪᆬ-ᆭᆰ-ᆵ←-↓│■○\u3000-。「-」\u3099-\u309Aァ-ロワヲ-ヴヷヺ-ー!-~¢-₩][',.A-Za-z~À-ÖØ-öø-ďĒ-ĥĨ-İĴ-ķĹ-ľŃ-ňŌ-őŔ-ťŨ-žƠ-ơƯ-ưǍ-ǜǞ-ǣǦ-ǭǰǴ-ǵǸ-țȞ-ȟȦ-ȳ\u0304Ӣ-ӣӮ-ӯḀ-ẙẠ-ỹᾱᾹῑῙῡῩK-Å]] ; |
+:: [:Latin:] fullwidth-halfwidth (); |
+:: NFD (NFC); |
+:: Lower (); # whenever transliterating from cased to uncased script, include this |
+$vowel = [aeiou] ; |
+$consonant = [bcdfghjklmnpqrstvwxyz] ; |
+$macron = \u0304 ; |
+$kana = [ぁ-ゔ] ; |
+$voice = [\u3099゛]; |
+$semivoice = [\u309A゜]; |
+$k_start = [カキクケコかきくけこ] ; |
+$s_start = [サシスセソさしすせそ] ; |
+$j_start = [シし] $voice ; |
+$t_start = [タチツテトたちつてと] ; |
+$n_start = [ナニヌネノンなにぬねの] ; |
+$h_start = [ハヒヘホはひへほ] ; |
+$f_start = [フふ] ; |
+$m_start = [マミムメモまみむめも] ; |
+$y_start = [ヤユヨやゆよ] ; |
+$r_start = [ラリルレロらりるれろ] ; |
+$w_start = [ワヰヱヲわゐゑを] ; |
+$v_start = [ワヰヱヲ]\u3099 ; |
+$voweled_basekana = [ァ-オカキクケコサシスセソタチッツテトナ-ノハヒフヘホマ-ヲヵヶ] ; |
+$n_quoter = [ア イ ウ エ オ ナ ニ ヌ ネ ノ ヤ ユ ヨ ン] ; |
+$small_y = [ャィュェョ] ; |
+$iteration = ゝ ; |
+'.' ↔ 。; |
+',' ↔ 、; |
+va ↔ ワ\u3099 ; |
+vi ↔ ヰ\u3099 ; |
+ve ↔ ヱ\u3099 ; |
+vo ↔ ヲ\u3099 ; |
+'~ka' ↔ ヵ ; |
+'~ke' ↔ ヶ ; |
+ya ← '~'ャ; |
+yi ← '~'ィ ; |
+yu ← '~'ュ; |
+ye ← '~'ェ; |
+yo ← '~'ョ; |
+a ↔ ア ; |
+b | '~' ← ヒ \u3099} $small_y ; |
+by } $vowel → ヒ\u3099 | '~y' ; |
+ba ↔ ハ\u3099 ; |
+bi ↔ ヒ\u3099 ; |
+bu ↔ フ\u3099 ; |
+be ↔ ヘ\u3099 ; |
+bo ↔ ホ\u3099 ; |
+c } i → | s ; |
+c } e → | s ; |
+da ↔ タ\u3099 ; |
+di ↔ テ\u3099ィ ; |
+du ↔ テ\u3099ゥ ; |
+de ↔ テ\u3099 ; |
+do ↔ ト\u3099 ; |
+dzu ↔ ツ\u3099 ; |
+dja ← チ\u3099ャ ; |
+dji'~i' ← チ\u3099ィ ; # liu |
+dju ← チ\u3099ュ ; |
+dje ← チ\u3099ェ ; |
+djo ← チ\u3099ョ ; |
+dji ↔ チ\u3099 ; |
+dj } $vowel → チ\u3099 | '~y' ; |
+cha ← チャ ; |
+chi'~i' ← チィ ; # liu |
+chu ← チュ ; |
+che ← チェ ; |
+cho ← チョ ; |
+chi ↔ チ ; |
+ch } $vowel → チ | '~y' ; |
+e ↔ エ ; |
+g | '~' ← キ\u3099} $small_y ; |
+gy } $vowel → キ\u3099 | '~y' ; |
+ga ↔ カ\u3099 ; |
+gi ↔ キ\u3099 ; |
+gu ↔ ク\u3099 ; |
+ge ↔ ケ\u3099 ; |
+go ↔ コ\u3099 ; |
+i ↔ イ ; |
+ja ↔ シ\u3099ャ ; |
+ji'~i' ← シ\u3099ィ ; # liu |
+ju ↔ シ\u3099ュ ; |
+je ↔ シ\u3099ェ ; |
+jo ↔ シ\u3099ョ ; |
+ji ↔ シ\u3099 ; |
+k | '~' ← キ} $small_y ; |
+ky } $vowel → キ | '~y' ; |
+ka ↔ カ ; |
+ki ↔ キ ; |
+ku ↔ ク ; |
+ke ↔ ケ ; |
+ko ↔ コ ; |
+m | '~' ← ミ} $small_y ; |
+my } $vowel → ミ | '~y' ; |
+ma ↔ マ ; |
+mi ↔ ミ ; |
+mu ↔ ム ; |
+me ↔ メ ; |
+mo ↔ モ ; |
+m } [pbfv] → ン ; |
+n | '~' ← ニ } $small_y ; |
+ny } $vowel → ニ | '~y' ; |
+na ↔ ナ ; |
+ni ↔ ニ ; |
+nu ↔ ヌ ; |
+ne ↔ ネ ; |
+no ↔ ノ ; |
+o ↔ オ ; |
+p | '~' ← ヒ\u309A } $small_y ; |
+py } $vowel → ヒ\u309A | '~y' ; |
+pa ↔ ハ\u309A ; |
+pi ↔ ヒ\u309A ; |
+pu ↔ フ\u309A ; |
+pe ↔ ヘ\u309A ; |
+po ↔ ホ\u309A ; |
+h | '~' ← ヒ } $small_y ; |
+hy } $vowel → ヒ | '~y' ; |
+ha ↔ ハ ; |
+hi ↔ ヒ ; |
+hu ↔ ヘゥ ; |
+he ↔ ヘ ; |
+ho ↔ ホ ; |
+fa ↔ ファ ; |
+fi ↔ フィ ; |
+fe ↔ フェ ; |
+fo ↔ フォ ; |
+fu ↔ フ ; |
+r | '~' ← リ } $small_y ; |
+ry } $vowel → リ | '~y' ; |
+ra ↔ ラ ; |
+ri ↔ リ ; |
+ru ↔ ル ; |
+re ↔ レ ; |
+ro ↔ ロ ; |
+za ↔ サ\u3099 ; |
+zi ↔ セ\u3099ィ ; |
+zu ↔ ス\u3099 ; |
+ze ↔ セ\u3099 ; |
+zo ↔ ソ\u3099 ; |
+sa ↔ サ ; |
+si ↔ セィ ; |
+su ↔ ス ; |
+se ↔ セ ; |
+so ↔ ソ ; |
+sha ← シャ ; |
+shi'~i' ← シィ ; # liu |
+shu ← シュ ; |
+she ← シェ ; |
+sho ← ショ ; |
+shi ↔ シ ; |
+sh } $vowel → シ | '~y' ; |
+ta ↔ タ ; |
+ti ↔ ティ ; |
+tu ↔ テゥ ; |
+te ↔ テ ; |
+to ↔ ト ; |
+tsu ↔ ツ ; |
+vu ↔ ウ\u3099 ; |
+u ↔ ウ ; |
+wa ↔ ワ ; |
+wi ↔ ヰ ; |
+wu → ウ ; |
+we ↔ ヱ ; |
+wo ↔ ヲ ; |
+ya ↔ ヤ ; |
+yi → イ ; |
+yu ↔ ユ ; |
+ye → エ ; |
+yo ↔ ヨ ; |
+s } sh → ッ ; |
+t } ch → ッ ; |
+j } j ↔ ッ } $j_start ; |
+b } b ↔ ッ } [$h_start$f_start] $voice; |
+d } d ↔ ッ } $t_start $voice; |
+g } g ↔ ッ } $k_start $voice; |
+p } p ↔ ッ } [$h_start$f_start] $semivoice; |
+z } z ↔ ッ } $s_start $voice; |
+v } v ↔ ッ } $v_start; |
+k } k ↔ ッ } $k_start ; |
+m } m ↔ ッ } $m_start ; |
+n } n ↔ ッ } $n_start ; |
+h } h ↔ ッ } $h_start ; |
+f } f ↔ ッ } $f_start ; |
+r } r ↔ ッ } $r_start ; |
+t } t ↔ ッ } $t_start ; |
+s } s ↔ ッ } $s_start ; |
+w } w ↔ ッ } $w_start; |
+y } y ↔ ッ } $y_start; |
+x } x → ッ ; |
+c } k → ッ ; |
+c } c → ッ ; |
+c } q → ッ ; |
+l } l → ッ ; |
+q } q → ッ ; |
+$macron ↔ ー ; |
+'~a' ↔ ァ ; |
+'~i' ↔ ィ ; |
+'~u' ↔ ゥ ; |
+'~e' ↔ ェ ; |
+'~o' ↔ ォ ; |
+'~tsu' ↔ ッ ; |
+'~wa' ↔ ヮ ; |
+'~ya' ↔ ャ ; |
+'~yi' → ィ ; |
+'~yu' ↔ ュ ; |
+'~ye' → ェ ; |
+'~yo' ↔ ョ ; |
+j $1 ← sh (y* $vowel) {ヽ$voice ; |
+dj $1 ← ch (y* $vowel) {ヽ$voice ; |
+dz $1 ← ts (y* $vowel) {ヽ$voice ; |
+g $1 ← k (y* $vowel) {ヽ$voice ; |
+z $1 ← s (y* $vowel) {ヽ$voice ; |
+d $1 ← t (y* $vowel) {ヽ$voice ; |
+h $1 ← b (y* $vowel) {ヽ$voice ; |
+v $1 ← w (y* $vowel) {ヽ$voice ; |
+sh $1 ← sh (y* $vowel) {ヽ$voice ; |
+j $1 ← j (y* $vowel) {ヽ$voice ; |
+ch $1 ← ch (y* $vowel) {ヽ$voice ; |
+dj $1 ← dj(y* $vowel) {ヽ$voice ; |
+ts $1 ← ts (y* $vowel) {ヽ$voice ; |
+dz $1 ← dz (y* $vowel) {ヽ$voice ; |
+$1 ← ($consonant y* $vowel) {ヽ$voice? ; |
+$1 ← (.) {ヽ $voice? ; # otherwise repeat last character |
+← ヽ $voice? ; # delete if no characters found |
+$voweled_basekana [\u3099 \u309A]? { h → ー ; |
+cy → セィ ; |
+dy → テ\u3099ィ ; |
+hy → ヒ ; |
+sy → セィ ; |
+ty → ティ ; |
+zy → セ\u3099ィ ; |
+h → ヘ ; |
+ch → チ; |
+sh → シ ; |
+dz → ツ\u3099 ; |
+dj → チ\u3099; |
+b → フ\u3099 ; |
+d → テ\u3099 ; |
+g → ク\u3099 ; |
+k → ク ; |
+m → ム ; |
+n'' ← ン } $n_quoter ; |
+n ↔ ン ; |
+p → フ\u309A ; |
+r → ル ; |
+s → ス ; |
+t → テ ; |
+y → イ ; |
+z → ス\u3099 ; |
+v → ウ\u3099 ; |
+f → フ; |
+j → シ\u3099; |
+w → ウ; |
+ß → | ss ; |
+æ → | e ; |
+ð → | d ; |
+ø → | u ; |
+þ → | th ; |
+c → | k ; |
+l → | r ; |
+q → | k ; |
+x → | ks ; |
+'~' → ; # delete stray tildes between letters |
+[:Katakana:] { '' } [:Latin:] → ; # delete stray quotes between letters |
+:: NFC (NFD) ; |
+:: ([[:Katakana:][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] halfwidth-fullwidth); |
+:: ( [[\ -~¢-£¥-¦¬\u0304₩。-하-ᅦᅧ-ᅬᅭ-ᅲᅳ-ᅵ│-○][~、-。がぎぐげござじずぜぞだぢづでどば-ぱび-ぴぶ-ぷべ-ぺぼ-ぽゔ\u3099-゛ゞァ-ヺー-ヾ][\u309B\u309C\u30A0\u30FC\uFF70\uFF9E\uFF9F]] ) ; |
Property changes on: icu46/source/data/translit/Latin_Katakana.txt |
___________________________________________________________________ |
Added: svn:eol-style |
+ LF |