白話字發音系統

前幾日仔,有去〈白話字台語文網站〉hia體驗hit-ê”白話字發音試驗系統“。 ah to̍h想講興興,罔變罔變,橫直即暫來講,暗時仔有影閒閒無創啥,著安呢罔chhē寡趣味的來做議量,消磨時間。初初kā試,soah有影bōe bái to̍h-tio̍h!唬,ah佫會講話,真正無簡單neh。路尾佫kā試了試,著發現講he oân-á無十全啦,原在 嘛是 有 帶 一寡 bug 佇咧。總是,猶原也是有改進的空間啦。比論講:

第一,有寡字讀bōe出來,系統自動安呢跳過踉過。這khiám-chhài是因為當初製作的時陣,一寡白話字的音節(音素)收錄無夠褿全(chiâu-chn̂g)的關係。

第二,有寡字音念無準。本然著念本調的,伊kâng讀變調;本然著念變調的,soah無變調。

第三,儂聲錄音、採集、處理chiah-ê算講是技術性的問題,嘛猶原有bug佇咧。Chiah-ê技術性的問題,對音長、音速、頻率……各項指標攏會影響。

第四,文字轉語音的過程,拍入去的文字kan-ta會當用”數字式”的白話字nā-niā,若是拍傳統的”調號白話字”著bōe用得。ah若”漢字”定著佫較bōe用得。

Hoān-sè猶佫有別項的問題佇咧,總是,一時嘛無法度攏chiâu共伊jîm-jîm出來。我即幾日仔,直透咧想,想講beh按怎來解決即mái我所拄著的chiah-ê問題。無的確儂早早著攏想過ah,嘛攏全chhiâu好勢ah,只不過我毋知影niā。哈哈,總是,無管儂有講過抑無,我的看法嘛是愛講出來,hoān-tú-sè另日我嘛會當在即个基础上有所改進,家己佫來變一項出來。哈哈,講笑的niā啦,阮無hiah才調啦。好啊,來講正經的。

頭 拄仔講有寡字讀bōe出來,系統跳過踉過的,是因為tng-tang時白話字的音節收集無全,若無,著是尾仔處理的時陣無細膩拍交落(phah-ka- la̍uh)去。從中來講,關係”音節收集無全”的問題,有一部分hoān-sè是在本無按算收錄的音節,看款是因為廈門音無,毋佫泉州音ia̍h是漳州 音有的,著無收錄在內——比論講”kūiⁿ”(縣)、”pūiⁿ”(飯)。另外,佫有一寡,照看是”變調音節”收錄無著,交落去——這著包括一部分“普通變調”、”輕聲”hām佮”第九聲”的(高升調)。摕輕聲的來講,比論即兩句話:”lí ū khì- -bô”、”sī lí the̍h- -khì-ê, sī- -m̄”,內中的輕聲”bô” 、”m̄”,soah攏讀bōe出來,變無聲去。佫來,ah若是第九聲的(高升調)讀bōe出來的,除去白話字本身有烏斑,無夠十全以外,嘛是有其它因的端(in-tek-toaⁿ)啦。這比論講”góa bōe-ēng-tit khì”即句話,實際定定”tit”免讀出聲,siâng時,“ēng”佫著愛讀第九聲的高升調。Ah若是“普通變調”讀無出來的,he 正正 是 無疑悟 交落去 的 音節。

佫來,講著”有寡字音念無準。本然著念本調的,伊kâng讀變調;本然著念變調的,soah無變調。”即个問題上少有兩个因由。第一,有可能是因為白話字本身的欠點或者是白話字的斷詞法猶無夠穩定造成的。共款的一个詞彙,有的儂連寫,有的分寫,無統一;一句話,中央該當佇tá-lo̍h停頓(分寫),該當佇tá-lo̍h sòa接(連寫),嘛是在儂su-kah,一儂寫一款,安呢結局,毋nā是”儂喙講的,佮手寫講出來的無共款”,嘛造成”拍字的,佮系統報的語音也無共款”。這第二嘛,著是”文字轉語音”程式設計的技術問題囉。比論講,” góa ū khoàⁿ-tio̍h lí “即句話,照講這”tio̍h”是著變調,不而過,因為程式設計的問題,文字轉語音了後,soah無kâng變調,害儂聽攏無。不而過,這第二个問題看起來真oh得處理。總講一句,電腦究竟是啞口機器,毋是儂,伊無法度百分百準確來判斷tī時著變調,tī時讀本調。比一例句啦,”kiâⁿ-ji̍p chhù-lāi chiah chai-iáⁿ”,即句話內底的”ji̍p”著變調,不而過”lāi”毋免,像安呢,電腦有影真歹liú-la̍k。我咧想,拍字的時陣,會當佇”ji̍p”佮”chhù”中央加一條踢跤線”_”,安呢電腦程式著愛改設計,予踢跤線”_”頭前的”ji̍p”讀變調。是講,安呢定著會加添用者拍字的負擔。像即款問題,beh按怎來chhiâu,實在考驗儂的智慧。

好,今仔日先講kah chia,另日若有學著mê-kak,chiah佫來講sòa落去。

Tagged:

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

*