2009/03/26

Unicode 補完計畫 For Linux

主要是為了解決在 PCMAN GTK+ 上,沒法子複製/貼上BIG5 日文字的問題

沒想到連 LINUX 都需要

Unicode 補完計畫


引用來源:http://forum.cpatch.org/archiver/?tid-6700.html

Unicode 補完計畫 ...... for Linux (glibc 2.3.2) !!

[這篇文章最後由Tiberius在 2005/11/27 01:22 編輯]

注意: 2005/11/22 字碼對應表修正, 請重新下載安裝!
http://mail.cs.nchu.edu.tw/~s9256043/uao-051123-bin.tar.gz
這是給 x86 使用的編譯版
使用方法與 chuchin 所說的一樣
檔案下載後把裡面的
BIG5.gz 與 UTF-8.gz 丟到 /usr/share/i18n/charmaps
BIG5.so 丟到 /usr/lib/gconv/
這樣應該就可以了
UTF-8.gz 修改的部份是「重新定義 CJK ambiguous width 字元為全寬度字元」,如此一來 BBS 常用的各式符號在轉成 UTF-8 之後才能正常顯示;此可配合 terminal emulator 轉碼、或是 screen 補完使用。
下面是改過的轉碼表原始檔 ... 有需要在其他平台使用的人,可自行取回編譯。
http://mail.cs.nchu.edu.tw/~s9256043/uao-051123-src.tar.gz
=============================
作者: Tiberius (必殺!PreCompile!!) 站內: GNU_Linux
標題: Unicode 補完計畫 ... for glibc 2.3.2 !!
時間: Mon Dec 1 12:46:08 2003
有在 Windows 下頭使用日文檔名的人
相信都有用過這個東西吧?
http://cpatch.org/unicode/
Unicode 補完計畫 - 把 BIG5 日文碼區對應到 Unicode 碼區的工具
話說昨天被 Samba 2.2 惡整,掉了一堆日文檔名 \"/
晚上輾轉難眠,想說試著解決看看這個問題好了?
於是跟原作者洽談,拿到了對應表,嘗試 porting 到 glibc iconv 下
然後成功了. XD
- ---
這邊提供的是一組拿來取代 glibc 內建 BIG5 的轉碼函式以及字碼對應表.
想嘗試看看的人,手邊請先準備好 latest glibc source (I'm using 2.3.2)
then get http://mail.cs.nchu.edu.tw/~s9256043/uao-051123-bin.tar.gz
抓下來解開之後,裡面有兩個檔案: BIG5 跟 big5.c
BIG5 覆蓋 glibc-2.3.2/localedata/charmaps/BIG5
big5.c 覆蓋 glibc-2.3.2/iconvdata/big5.c
然後照以往的方式 compile & install glibc, 完成!
- ---
如果你用 Gentoo 的話,那更簡單了:
cd /usr/portage/sys-libs/glibc
ebuild glibc-2.3.2-r9.ebuild unpack
cd /tmp
wget http://mail.cs.nchu.edu.tw/~s9256043/uao-051123-bin.tar.gz
tar zxvf big5-extension.tar.gz
cd /var/tmp/portage/glibc-2.3.2-r9/work/glibc-2.3.2
cp /tmp/BIG5 localedata/charmaps/BIG5
cp /tmp/big5.c iconvdata/big5.c
cd /usr/portage/sys-libs/glibc
ebuild glibc-2.3.2-r9.ebuild compile
ebuild glibc-2.3.2-r9.ebuild install
ebuild glibc-2.3.2-r9.ebuild qmerge
ebuild glibc-2.3.2-r9.ebuild clean
- ---
搞定之後測試看看,先去抓個可以換語系的 terminal:
emerge gnome-terminal
LANG="zh_TW" gnome-terminal &
字型選個 "細明體" 或是 "MS 明朝"
然後 telnet 回來看看這篇文章
注意看底下我的簽名檔,日文假名有沒有出現? XD
- ---
原本的硬碟裡頭,或許有不少 Big5 日文假名的檔案吧?
沒問題,挖他出來!
新核心的 vfat 檔案系統模組有支援直讀 unicode 檔名
(fat32 的檔名其實就是用 unicode 儲存在磁碟上的)
先把檔案系統掛起來:
mkdir /mnt/d
mount -t vfat /dev/hdb1 /mnt/d -o utf8=1
不過正確看到 unicode,必須有語系支援
所以在第一次嘗試列表之前,要先造一下中文的 UTF-8 語系:
localedef -i zh_TW -f UTF-8 zh_TW.UTF-8
然後用這個新語系開個 terminal:
LANG="zh_TW.UTF-8" gnome-terminal &
接下來當然進去看看:
ls /mnt/d/myfiles
以往收藏的日文檔名現身了嗎? XD
把 XCIN 叫出來,在這個視窗裡頭打中文看看
會發現,這時輸入在這個 terminal 裡頭的中文,也會被自動轉碼成 UTF-8 哦
... (我用的輸入法是酷音)
That's all for now, ENJOY!
- ---
晚些我會把這個 table 送回 Unicode 補完計畫的原作者群
或許他們有更好的方法與計畫來推廣這個套件
嘿嘿,去找找日文假名輸入法 for XCIN ... XD
- --
…ガソ乾ゆギ哀愁ソ瞳ズ去來エペパソゾ何ろ?
失ゲギパソ 得ギパソ
ガウサ廣大スбЧЬソ狹間ザ彼ゎ見ギパソシゾ?
虛像シ實存シ記號ソ中ズ彼ゾ今、何メ想よソろ?
-- battle programmer SHIRASE
- --
┌┼ Author: 中興資科˙中興資科 e資獨秀 csNCHU.twbbs.org
└┘ Origin: Tiberius 從 sw64-93-112.adsl.seed.net.tw 發表
------
補充說明:
我目前還沒有研究出要如何單獨編譯出 BIG5.so 這個檔案。
如果有哪位先進知道怎麼做的話,就麻煩貼出來造福大家一下囉!
補充說明二:
This package is provided AS-IS.
除了跟著官方的新對照表提供新版之外,我目前暫時沒有餘力進行其餘的 support 工作 ...

沒有留言: