272710. UTF-8を使う | mbyte-utf8 |
282811. 主なオプション | mbyte-options |
2929
30- NOTE: このファイルにはユニコードの文字が含まれている。他のエンコーディングを使
31- 用している場合は 、変な文字、あるいは四角形として表示されるかもしれない。
30+ NOTE: このファイルにはUnicodeの文字が含まれている。他のエンコーディングを使用
31+ している場合は 、変な文字、あるいは四角形として表示されるかもしれない。
3232
3333==============================================================================
34341. はじめに (Getting started) *mbyte-first*
@@ -317,12 +317,12 @@ Note: すべてのエンコーディングは0から128までの文字がASCII
3173172 euc-tw 繁体中国語 (Unix only)
3183182 2byte-{name} Unix: ダブルバイトエンコーディングのどれか (Vim特有の名前)
3193192 cp{number} MS-Windows: インストールされているダブルバイトのコードページ
320- u utf-8 UTF-8にエンコードされた32ビットのユニコード (ISO/IEC 10646-1)
321- u ucs-2 UCS-2にエンコードされた16ビットのユニコード (ISO/IEC 10646-1)
320+ u utf-8 UTF-8にエンコードされた32ビットのUnicode (ISO/IEC 10646-1)
321+ u ucs-2 UCS-2にエンコードされた16ビットのUnicode (ISO/IEC 10646-1)
322322u ucs-2le リトルエンディアンのucs-2
323323u utf-16 ucs-2を拡張してさらに多くの文字を表現できるようにしたもの
324324u utf-16le リトルエンディアンのutf-16
325- u ucs-4 UCS-4にエンコードされた32ビットのユニコード (ISO/IEC 10646-1)
325+ u ucs-4 UCS-4にエンコードされた32ビットのUnicode (ISO/IEC 10646-1)
326326u ucs-4le リトルエンディアンのucs-4
327327
328328{name} にはシステムがサポートしているエンコーディングの名前を入れることができ
@@ -418,8 +418,8 @@ MS-WindowsはリトルエンディアンのUCS-2を使用するので、MS-Windo
418418
419419 Unicode 8bit 機能する。(普通はこうしない)
420420 Unicode 2byte 機能しない。
421- Unicode Unicode 問題なく機能する。(Vim内部ではユニコードはすべてUTF-8
422- で扱われるため 、'termencoding' が空でも同じく機能する)
421+ Unicode Unicode 問題なく機能する。(Vim内部ではUnicodeはすべてUTF-8で扱
422+ われるため 、'termencoding' が空でも同じく機能する)
423423
424424エンコーディングの変換 *charset-conversion*
425425
@@ -475,7 +475,7 @@ Vimはいろいろな場面で自動的にエンコーディングを変換す
475475'encoding' の設定と違うエンコーディングのファイルを読み書きするときは、エンコー
476476ディングを変換する必要がある。次の変換がサポートされている:
477477- Latin-1(ISO-8859-1)、UTF-8、UCS-2、UCS-4の間の変換はVimが自前で行なう。
478- - MS-Windowsでは、'encoding' がユニコードなら各コードページとの変換は機能する 。
478+ - MS-Windowsでは、'encoding' がUnicodeなら各コードページとの変換は機能する 。
479479- 'charconvert' による変換。
480480- 可能であれば、iconvライブラリを使用して変換することができる。
481481 古いバージョンのGNU iconv()では変換が失敗することがある(Vimが用意する
@@ -502,9 +502,8 @@ GUIではマルチバイト文字を完全にサポートしている。端末
502502を設定する。Vimは入力された文字を'termencoding' から'encoding' へと変換する。そ
503503して表示するときに'encoding' から'termencoding' へと変換する。端末のエンコーディ
504504ングに、Vimが取り扱う文字がすべて含まれていない場合、文字の情報が失なわれてし
505- まう。下記で説明しているxtermのように、ユニコードをサポートしている端末なら問
506- 題はない。ほぼすべての文字セットは情報を失なわずにユニコードに変換できるからで
507- ある。
505+ まう。下記で説明しているxtermのように、Unicodeをサポートしている端末なら問題は
506+ ない。ほぼすべての文字セットは情報を失なわずにUnicodeに変換できるからである。
508507
509508
510509UTF-8をXFree86 xtermで使う *UTF8-xterm*
@@ -1213,13 +1212,13 @@ Combining forms:
12131212==============================================================================
1214121310. UTF-8を使う (Using UTF-8) *mbyte-utf8* *UTF-8* *utf-8* *utf8*
12151214 *Unicode* *unicode*
1216- ユニコードは 、他の文字セットをすべて含むように設計された。そのため、どんな言語
1217- のテキストでもユニコードを使って書くことができる (希少な言語を除く)。そして、他
1218- のエンコーディングでは混在させることが不可能な言語でも、一つのファイルに混在さ
1219- せることが可能である 。
1215+ Unicodeは 、他の文字セットをすべて含むように設計された。そのため、どんな言語の
1216+ テキストでもUnicodeを使って書くことができる (希少な言語を除く)。そして、他のエ
1217+ ンコーディングでは混在させることが不可能な言語でも、一つのファイルに混在させる
1218+ ことが可能である 。
12201219
1221- ユニコードにはいくつかのエンコード法がある 。もっとも一般的なのは、1文字を 1 ま
1222- たは複数バイトで表わすUTF -8であり、ASCII と後方互換性がある。MS-Windowsでは
1220+ Unicodeにはいくつかのエンコード法がある 。もっとも一般的なのは、1文字を 1 また
1221+ は複数バイトで表わすUTF -8であり、ASCII と後方互換性がある。MS-Windowsでは
12231222UTF-16 も使われる(以前は UCS-2 と呼ばれていた)。こちらは 16 ビットを基本単位と
12241223する。Vimはこれらのエンコーディングすべてをサポートしているが、Vim でユニコー
12251224ドを使う場合、内部では常に UTF-8 が使われている。
@@ -1235,8 +1234,8 @@ Vimは幅広くUTF-8をサポートしており、それは以下の環境で機
12351234空白で埋められる。Note:オプション'guifontset' はGTK+ 2 GUIでは使用しない。
12361235
12371236 *bom-bytes*
1238- ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのユニコードエンコー
1239- ディングを判別するのに使われる :
1237+ ファイルを読み込むとき、BOM (Byte Order Mark)があれば、そのUnicodeエンコーディ
1238+ ングを判別するのに使われる :
12401239 EF BB BF utf-8
12411240 FE FF utf-16 big endian
12421241 FF FE utf-16 little endian
@@ -1275,9 +1274,9 @@ Overlong sequenceに対して特別な処理はされない。通常の文字と
12751274{訳注: たぶん、"<00> "と表示されてるOverlong sequenceだけはたとえ| /\_. | でもマッ
12761275 チしないということ。}
12771276
1278- ファイルやバッファには、ユニコードで表現できる範囲 (31ビット)の文字をすべて書く
1279- ことができる 。ただし、それを表示できるのは使用フォントがその文字を提供している
1280- 場合のみ 。
1277+ ファイルやバッファには、Unicodeで表現できる範囲 (31ビット)の文字をすべて書くこ
1278+ とができる 。ただし、それを表示できるのは使用フォントがその文字を提供している場
1279+ 合のみ 。
12811280
12821281便利なコマンド:
12831282- "ga"はカーソル位置の文字のコードを10進数、16進数、8進数で表示する。合成文字
0 commit comments