2018年10月18日 星期四

字型的深度學習(1)

之前看到日星初號楷體的時候,對這種字型相當著迷,無奈我得知這款字型的當下,日星鉛華網站已經停止服務,我甚至連這個網站原本長啥款都還不知道。
然後,我找到這家鉛字行的粉絲專業
似乎嗅出了那麼一點字型為何停止開放下載的理由,似乎是部分鉛字師父認為部分字型透過數位呈現出來的效果跟他們想的不一樣。

不過,我個人看到這款字型的問題,跟鉛字師傅在意的點完全不一樣,我認為缺字率太高的字型很難被接受,更甭論廣泛使用,畢竟字型這種東西要有人使用,才會被看到才會有人記住。但要克服缺字率這一點似乎就又回到了﹝人力短缺﹞這個很根本的老問題,畢竟鉛字行也算是夕陽產業沒錯吧?願意投入這一行,要能長期執行甚至以此養家活口的人,相對來說應該會很少。所以才冒出了『保留傳統工藝 發揮漢字文化價值』這樣豪邁的標語,打著文化價值的觀點來提倡這項技藝。

感覺這套字型如果還有下一步(也許已經完全停止開發),可能會是刻字老師傅要徹底教會製造數位字型的年輕字型設計師,然後這位還要這數位相對年輕的數位字型設計師還有辦法持續養活自己,持續造字(因為常用字數應該3k-5k可能跑不掉, 全字庫可能也要40k up才算),我們才有可能看到下一代字數足夠的「日星貳號楷體」

但,我有個不同的想法!


如果學會鉛字符號造型精隨的那個傢伙,不是人類,而是一台電腦呢?

如果我們讓人工智慧學會這個字型的外貌(如同老師傅訓練新手學徒造字),接著再讓這個二位元世界的學徒,自動去產生其他字符,是不是就比較有機會產生一個字數足夠的數位字型呢?

一般而言,人工智慧分成training/inference兩個步驟,前者是學習階段,後者算是應用階段。

舉例來說,支付寶電子支付廠商,如果想透過人工智慧的方式來辨識人臉,並加以自動扣除消費者的電子錢包,在他推出這項服務之前,他得先透過一系列複雜的學習跟計算過程,訓練出一的程式模型,而這一段程式碼專精於讀取圖片來進行人臉辨識,最後對應到某特定帳號,那這一段訓練過程叫做training;

而當支付寶公司推出這項服務之後,用戶手機裡面或者結帳櫃台上的電腦裡面,在適當的場合(結帳)來執行這段程式碼進行辨識,叫做inference。

如果有一套方法能夠讓某特定人工智慧程式能夠學會某特定字型的眉眉角角(training),那麼之後要產生數位字型的時候(inference),應該就有機會能夠大量生產眾多中文字符,省去冗長的琢磨時間,藉此解決字數不足的困處

沒有留言: