文字コードの種類は何故複数あるのでしょうか?
1 :デフォルトの名無しさん :04/08/23 17:55.net 1つにしてくれればPGが苦労することはなくて 、ミンナうれしいはずなのに。
2 :デフォルトの名無しさん :04/08/23 18:00.net そんなことでスレを立てないで下さい。
3 :デフォルトの名無しさん :04/08/23 18:35.net >>1 アニメの世界であれば、そういう迷惑なことをするのは悪の組織ですよね? 現実の社会ではどうでしょう? クリーンなイメージのあの組織も、もしかすると悪の組織なのかもしれませんね。 私は、大義名分を振りかざすこと、常に勝つことが重要であると考えています。
4 :デフォルトの名無しさん :04/08/23 18:59.net >>1 それが資本主義。
5 :デフォルトの名無しさん :04/08/23 19:11.net じゃあ共産圏は一つに統一されているのか。
6 :マイク ◆yrBrqfF1Ew :04/08/23 19:14.net 宗教戦争の為だ。
7 :デフォルトの名無しさん :04/08/23 19:34.net 統一されてないから。
8 :デフォルトの名無しさん :04/08/23 20:21.net なら、>>1 が新しい統一した文字コードを作れ。
9 :デフォルトの名無しさん :04/08/23 20:33.net >>8 また増えるからもういいよ
10 :デフォルトの名無しさん :04/08/23 20:55.net 2バイト文字を使わなけりゃいいべや。
11 :デフォルトの名無しさん :04/08/23 21:11.net ? おまえら、まだ文字コード使ってるの? 俺はだいぶ前から文字しか使ってないよ。
12 :デフォルトの名無しさん :04/08/23 21:36.net あめれか人が悪いに決まってるだ
13 :デフォルトの名無しさん :04/08/23 21:48.net もう全部ビットマップでいいよ。
14 :デフォルトの名無しさん :04/08/23 21:54.net >>12 欧米人は頭足りないからな
15 :デフォルトの名無しさん :04/08/23 22:24.net UNICODE がもう少しまともだったらなぁ。
16 : ◆Z0vd5w812U :04/08/23 23:09.net >>15 所詮は「なんでアルファベット以外が存在してんだよ」と思ってる連中が作った規格。
17 :デフォルトの名無しさん :04/08/23 23:23.net 1.0と比べると3.2はずいぶんマシになってるし あと20年もすれば納得いくものになるんじゃないの
18 :デフォルトの名無しさん :04/08/24 14:16.net Unicode1は所詮ローカライズ用
19 :デフォルトの名無しさん :04/08/29 03:15.net アルファベットの文字コードも複数あるわけですが…
20 :デフォルトの名無しさん :04/09/24 18:55:46.net ここを見れ! http://www.pahoo.org/e-soul/webtech/encode/encode01-01.shtm
21 :デフォルトの名無しさん :04/10/12 18:24:05.net http://www005.upp.so-net.ne.jp/p-move_h/constitution.htm 本来神聖なる日本国憲法を記載するに当たり一字一句変える ことなく記載しなければならないところですが、コンピューター 通信上の禁則文字(JISコードに含まれていない文字)があり、 読み方は一緒なのですが例えば「わゐうゑを」2番目の「ゐ」を「い」 に4番目の「ゑ」を「得」に変更させていただきました。 あしからずご了承下さい。 「ゐ」「ゑ」はJISコードに無い文字なのか?
22 :デフォルトの名無しさん :04/10/12 18:35:39.net 改行コードの種類は何故複数あるのでしょうか?
23 :デフォルトの名無しさん :04/10/12 19:52:02.net 大人の事情
24 :デフォルトの名無しさん :04/10/12 23:11:08.net >>21 「禁則文字」の用語にも誤解があるようでつね
25 :デフォルトの名無しさん :04/10/14 00:12:52.net >>22 昔々、テレタイプという通信機には プラテンを1行分進めるラインフィードという制御コードと 印字ヘッドを左に戻すキャリッジリターンという制御コードが別々にあった そんでこいつは初期のコンピュータにつないで端末として使ったりもした。 それが今の改行コードの元になったわけだが MS−DOS,->Windows系列では律儀に上記二つペアを改行コード としてそのまま引き継いだ UNIX系だとニューライン(ラインフィード)LFだけになり Mac系はキャリッジリターンだけを改行コードとして採用した。 ネットワークプロトコルではCRLFが今でも 改行コードの標準だが、 これは テレタイプ->ダム端末->telnet,rloginの流れで改行コードも 引き継がれたからだ。
26 :デフォルトの名無しさん :04/10/16 22:39:45.net >>25 答えキタ━━━━━━(゚∀゚)━━━━━━ !!!! ありがとう UNIXがLFなのになんでネットワークがCRLFになっちまったのかと思ってたんだよ
27 :デフォルトの名無しさん :04/10/16 23:36:27.net ttp://satosan.jp/ClangStudy.html > 遠隔地同士の通信手段としてテレタイプ(通信機能をもった > タイプライター) が使われていた頃は、ヘッドが行の端まで > 行ったとき次の行の先頭に戻るま で、2文字分通信するのと > 同じ時間がかかった。 > そこで改行の文字コードをCR(復帰:キャリッジリターン '\r')と > LF(改行: ラインフィード '\n')の2つに割り当てた。
28 :デフォルトの名無しさん :04/10/18 20:43:35.net エンディアンの種類は何(ry
29 :デフォルトの名無しさん :04/11/30 13:59:22.net age
30 :デフォルトの名無しさん :05/02/10 22:10:51 .net TRONコード
31 :デフォルトの名無しさん :05/02/10 22:25:42 .net >>27 理由になってないし
32 :デフォルトの名無しさん :05/02/17 00:28:22 .net 「qwerty配列はタイピングが早すぎてキーが絡まないようにわざと打ちにくくした」 って都市伝説もあったな
33 :デフォルトの名無しさん :05/02/17 01:19:18 .net キーが絡むなら都市伝説だな。 絡むのはハンマーだから。
34 :デフォルトの名無しさん :05/02/18 01:04:22 .net >>32 適度に打ちにくくしたのは確かだよ。 最悪に打ちにくくしたわけではない。 最高に打ちやすくしたわけでもない。 最適に打ちにくくしたんだよ。 機械とセールスの拮抗点で。
35 :デフォルトの名無しさん :05/02/18 19:00:00 .net 文字コードと関係ないぞ
36 :デフォルトの名無しさん :05/02/19 00:20:50 .net そもそも、自然言語が複数あるんだから、 文字コードが複数出来るのも自然な流れだと思われ
37 :デフォルトの名無しさん :05/02/23 17:40:30 .net >>1 すべて Unicode Consortium が悪い。 そうに決まってる。
38 :デフォルトの名無しさん :05/02/23 19:12:17 .net >>28 普通の答えは、big-endian と little-endianの2種類だが、 3-4-1-2 や 2-1-4-3 など順序になる不可解なシステムが、過去のミニコン時代にありますた。 それらは、middle-endian と呼ばれている。 よって、32ビットでのエンディアンの種類は4種類という事になる。
39 :デフォルトの名無しさん :05/02/23 19:26:44 .net 24種類じゃないの。
40 :デフォルトの名無しさん :05/02/23 19:49:20 .net 実在が確認されているのが4種類、可能性としては24種類、ということで。
41 :デフォルトの名無しさん :05/02/23 21:09:47 .net XMLの仕様書に書かれてる3-4-1-2や2-1-4-3って実在したのか >>37 ワロス
42 :デフォルトの名無しさん :05/02/23 22:23:06 .net >>1 容量制限のため用途に応じた使い分けをせざるを得なかった歴史があるからだよ。 たしかに文字コードの乱立はうざい。 こんなに大容量化が進んでマシンのスペックも向上しているにもかかわらず 文字コードが未だに乱立している原因として考えられることは 面倒くさがり屋、変化を恐れる愚かな老人達が我々の行動を阻もうとしていることがあげられる。 日本国内でオブジェクト指向が普及しない原因も、自分の立場を維持したい愚かな老人が 妨害しているのが原因かもしれない。 かつて、ある企業が独自規格を作って大儲けを たくらんだために文字コードが乱立した可能性もありうる。 今ではUnicodeがあるというのにほとんどの新しい言語、OSは Unicodeが標準だというのに 頭の古い連中は大したコストパフォーマンスにならないにもかかわらず 容量制限が・・・ 既存のリソースが・・・・ などといってUnicodeを採用しようとしない。 既存のリソースならUnicodeに変換すればいいことだろう。 まったく愚かだ。Unicodeに鞍替えできない老舗顧客も老舗プログラマも。
43 :デフォルトの名無しさん :05/02/23 22:32:12 .net お前が愚かだ。
44 :デフォルトの名無しさん :05/02/23 22:46:26 .net キーボードは乱立しなくてよかったw
45 :デフォルトの名無しさん :05/02/24 10:05:30 .net 乱立してるだろ
46 :デフォルトの名無しさん :05/02/24 15:47:01 .net 「俺たちはどうして何でもUnicodeのせいにするのだろう?」 文字鏡関係者とTRON関係者とGTプロジェクト関係者が何人か集まって考えた。 しかしいくら考えても結論が出ない。その時、一人がひらめいた。 「それもUnicodeのせいだ!」 関係者は全員それで納得した。
47 :デフォルトの名無しさん :05/02/24 18:11:09 .net Windowsもとっととunicodeに移行して欲しいよ
48 :デフォルトの名無しさん :05/02/24 19:13:03 .net してるじゃん 出来てないのはiniファイルくらいだろ?
49 :デフォルトの名無しさん :05/02/25 06:57:00 .net どうか教えてください。 [1] 授業単元:プログラム概論 [2] 問題文(含コード&リンク): シフトJISからEUCへの文字コード変換プログラムを作りたい(余裕があればその逆も) http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/programming/prog1.txt [3] 環境 [3.1] OS: WindowsXP,NT Solaris2.0 [3.2] コンパイラ(バージョン):富士通fcc,Cygwin(gcc) [3.3] 言語:C [4] 期限:2005年2月28日12:00まで [5] その他の制限: この問題文の意図だと引数をunsigned int型にするべきかどうか分からない
50 :デフォルトの名無しさん :05/02/25 09:58:13 .net >>49 #include <stdlib.h> main() { return system("nkf -e from > to"); } つーかスレ違い
51 :デフォルトの名無しさん :05/02/25 11:22:52 .net >>41 3-4-1-2ってのは、最小アクセス単位が16 bitでbig-endianなCPU (3-4)-(1-2) 別名middle endian wordにpackするとこの形になった。(Cの先祖のBCPL、初期のpascal等) >>27 それは嘘。(そもそも復帰は物凄く時間がかかる) タイプライター時代から、(行先頭に)復帰して文字を進めて重ね打ち、例えば _ を、 ってのがあって、それをプリンタにも持ち込んだのが最初。
52 :デフォルトの名無しさん :05/02/25 11:26:29 .net >>50 ワラ 幾らなんでもそれはないから > return system("iconv -f shift_jis -t euc-jp < from > to"); でどうだ?
53 :デフォルトの名無しさん :05/02/25 15:51:32 .net 簡単な質問かもしれませんが、分からないので教えてください。 以下のプログラム、核は出来ています。このまま使用しても目的は達成できます。が、 http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CSJS2EUC.C http://tokyo.cool.ne.jp/kuonnnokizunanbalivetehe/CEUC2SJS.C この2つのソースコードをJISを経過させずに直接変換させるにはどうしたらいいでしょうか?
54 :デフォルトの名無しさん :05/02/25 16:02:46 .net >>53 何故一つの質問をあっちこっちで聞きまくるんだ 頭おかしいんじゃないか?
55 :デフォルトの名無しさん :05/02/25 19:04:25 .net あちこちで聞けば、たくさんの人が並行して考えてくれるので、 答えが早くでると思いました。 どこか答えが出てるスレッドがありましたら教えてください。
56 :デフォルトの名無しさん :05/02/25 19:36:43 .net だから、テーブルを使えよ。
57 :デフォルトの名無しさん :05/02/25 19:46:47 .net >>48 コマンドプロンプトとか無理だろ
58 :デフォルトの名無しさん :05/02/25 19:55:45 .net 無理じゃ無いよ ちゃんとユニコードなファイル名も表示されるし
59 :デフォルトの名無しさん :05/02/25 22:43:07 .net > あちこちで聞けば、たくさんの人が並行して考えてくれるので、 > 答えが早くでると思いました。 > どこか答えが出てるスレッドがありましたら教えてください。 ・・・こういう心理をどう表現すればいいのだ? 自己中心的か ゲーム脳か
60 :53@愛宕山 :05/02/25 23:13:03 .net ちなみに55はボクではありません。今さらどうでもいいけど
61 :デフォルトの名無しさん :05/02/26 01:45:06 .net >>59 全員から同時に返事が来たらどうするつもりなんだろうね
62 :デフォルトの名無しさん :05/03/01 21:40:00 .net そこで超漢字
63 :デフォルトの名無しさん :2005/04/30(土) 21:51:28 .net うにこーど
64 :デフォルトの名無しさん :2005/05/01(日) 11:20:17 .net >>57 localeモデルにしとけば、Shift_JIS→UTF-8移行も楽だったね。
65 :デフォルトの名無しさん :2005/05/03(火) 05:47:35 .net UNICODEだってごちゃごちゃの固まりジャン こんな気味悪い文字コードにしなくちゃいけないのはいやだ
66 :デフォルトの名無しさん :2005/05/03(火) 07:29:57 .net UTF-8は使用するメモリが1.5倍になるからいやだ
67 :?デフォルトの名無しさん :2005/05/03(火) 20:19:22 .net UTF-8で1.5倍とはしらなかった。
68 :デフォルトの名無しさん :2005/05/04(水) 00:05:00 .net 漢字のコードポイントのとこなら1文字3バイトだけどね。
69 :デフォルトの名無しさん :2005/05/04(水) 00:05:32 .net あ、3オクテットというべきかにゃ?
70 :デフォルトの名無しさん :2005/05/05(木) 17:46:59 .net 4オクテットの箇所もあるでよ。
71 :デフォルトの名無しさん :2005/11/19(土) 21:54:11 .net そこでシフトJISですよ。JIS第3水準、第4水準も難なく扱えるし、な。
72 :デフォルトの名無しさん :2005/11/19(土) 22:22:21 .net つうか、そろそろJIS廃止してくれんかの。 シフトコードウザイ。
73 :デフォルトの名無しさん :2005/11/19(土) 22:27:05 .net UCS-4ってのが最後のUnicode? Javaだとint型なんだっけ?よーわからんけど、早く統一して欲しい。
74 :デフォルトの名無しさん :2005/11/19(土) 22:43:03 .net >>73 1文字8バイトなんて世界が来るのかね。
75 :デフォルトの名無しさん :2005/11/19(土) 22:44:51 .net UTF-8でいいんでしょ?〜とか@とか大丈夫なんでしょ?
76 :デフォルトの名無しさん :2005/11/19(土) 22:53:34 .net >>75 いまのWord、ExcelはUCS-2だから、その世界に収まっている 仕事ならUTF-8でおけですよ。 でもオヤクソとかは…
77 :デフォルトの名無しさん :2005/11/20(日) 01:29:07 .net やっぱり生き残るのはシフトJIS系。 将来的には半角カナの領域を1バイト目にして可変長のコードにして UnicodeやTRONコード、JEF、KEISを丸呑み。 絶対そうなる。
78 :デフォルトの名無しさん :2005/11/20(日) 01:31:35 .net >>76 じゃあUCS-4でいいから今すぐ統一して( ノ><)ノ
79 :デフォルトの名無しさん :2005/11/24(木) 02:30:44 .net 常用漢字とJISが食い違ってるというのもそもそもどんな縦割り行政 しちょるのかと
80 :デフォルトの名無しさん :2005/11/24(木) 13:11:35 .net 何か食い違ってたっけ?
81 :デフォルトの名無しさん :2005/11/25(金) 21:34:50 .net 龍の旧字体?
82 :デフォルトの名無しさん :2005/11/25(金) 21:35:24 .net 竜の旧字体? だった 龍じゃそのまんまじゃんorz
83 :デフォルトの名無しさん :2005/11/28(月) 16:44:09 .net 「龍」の点の向きのこと? そんなもん包摂の範囲内だしどっちだっていいやん。 表外漢字字体表にがちがちにあわせたJIS X 0213:2004のほうが異常。
84 :デフォルトの名無しさん :2005/11/29(火) 08:28:23 .net 大体、印刷標準字体とかうざいんじゃ!
85 :デフォルトの名無しさん :2006/02/06(月) 15:57:56 .net だって常用漢字の数とJIS漢字の数とそもそもぜんぜん違うじゃん たしか常用漢字にあってJISにない漢字とか結構なかったっけ? それより写植の文字がJISに入ってないせいで電話記号とか ポゲムタとかが簡単に出せなくてラムちゃん語も満足に表記できやしない。
86 :デフォルトの名無しさん :2006/02/06(月) 16:36:04 .net >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ? >たしか常用漢字にあってJISにない漢字とか結構なかったっけ?
87 :デフォルトの名無しさん :2006/03/13(月) 10:43:01 .net いま試しに数えてみたら24個くらいあった
88 :デフォルトの名無しさん :2006/03/25(土) 09:27:36 .net >>87 夜に数えると増えてるよ。 うちの家の階段も昼間は12段だけど 夜数えると13段ある。
89 :デフォルトの名無しさん :2006/03/26(日) 12:55:29 .net たしかJISにあって常用漢字にない漢字とか結構なかったっけ?
90 :デフォルトの名無しさん :2006/03/27(月) 02:43:17 .net ない。
91 :デフォルトの名無しさん :2006/05/01(月) 11:42:30 .net お前ら大嘘つきだ。みんな嫌いだ。
92 :デフォルトの名無しさん :2006/05/04(木) 13:03:48 .net 文字コードが増える前に、俺らが使う言葉の数を減らせばいいんじゃね?
93 :デフォルトの名無しさん :2006/05/05(金) 07:04:34 .net たしかに。英語だけあれば世の中困ること無いよな。
94 :デフォルトの名無しさん :2006/05/30(火) 02:39:01 .net そうだ。
95 :デフォルトの名無しさん :2006/06/16(金) 19:34:55 .net >>66 UTF-8って英数字に対して使うなら容量はそんなに増えなかったかと。
96 :デフォルトの名無しさん :2006/07/06(木) 04:23:37 .net 戦争中、敵方の兵士により領土が侵略されると、必ず略奪やレイプがおこなわれる。ルワンダもその例外ではなかった。 大統領の暗殺から2週間ほどたったころ、ルワンダ北西部のルヘンゲリ県のある村で14歳のツチ族少女がフツ族民兵に誘拐された。 当時すでに虐殺の嵐はルワンダ全土を激しく吹き荒れ、各地で次々とツチ族が殺されていた。しかし幸いなことにその村ではまだ一人の死者も出さず、ツチ族とフツ族が微妙なバランスの上で共生していた。 誘拐された少女は、「気立てが良くかわいい娘だ」と村で評判だったらしい。その日も夕食の準備をする母を手伝うため、水を汲みに村外れの井戸へ行き、そこで待ち伏せていた数人の男に拉致されてしまったのだ。 何人かの村人がその様子を目撃し、すぐさま家族に知らせた。家族は娘の身に起こりうる最悪の事態(レイプされた後、殺害される)を考え、血眼になって探したが、1週間たっても少女の行方はわからなかった。 さらに数日が過ぎ家族があきらめかけたころ、隣村から連絡が届いた。 「娘さんらしき少女を保護した。重体ではあるものの生きてはいる」 家族は押っ取り刀で隣村に駆けつけ、粗末なベッドの上で毛布に包まれ、横たわる少女の姿を見た。 体を包んでいる毛布に血がにじみ、見る影もなくやせ細った体は小刻みに震え、その瞳は輝きなく虚空を見つめていた。家族が声をかけても何も反応を示さない。脅えているのか寒いのか、ただ小さく震えるだけだ。
97 :デフォルトの名無しさん :2006/07/06(木) 04:24:30 .net 少女は非常に奇異な姿で発見されたという。隣町の農夫は発見したときの様子をこう語る。 「私がいつものとおり自分の畑を耕すためにあぜ道を歩いていると、ふと視界に見慣れないものが目に入ったのです。 最初は『木の切り株か、大きな石なのかなあ』と思ったのですが、近づいてみると違いました。目を疑いましたよ。裸の少女が腰から下を土に埋められていたのですから……。 私が発見したとき、彼女は焦点の定まらない目でぼんやりと遠くを見つめ、半開きになった口からよだれを垂れ流していました。 インタラーメ(フツ族民兵)か政府軍が近くにいるのではと思ったので、慌てて村にいったん帰りました。人を集め武器を持ち、恐る恐るその場に戻って、彼女を掘り返したのです。 目は開いていたのですが、すでに彼女の意識はありませんでした」 変わり果てた姿の少女を、家族はすぐさま村から少し離れたところにあったフランスの緊急医療援助団体“国境なき医師団”の診療所へと運び込んだ。 偶然、その少女の治療に日本人看護婦、山本珠江さんが立ち会っていた。
98 :デフォルトの名無しさん :2006/07/06(木) 04:26:13 .net 「数人の男たちに、彼女は何日間にもわたり強姦され続けていたみたいなの。食事もろくに与えられていなかったようね。 しかも土に埋められる前、女性器に木の棒か銃身のような細くて固いものを押し込まれ、こねくり返されたようなのよ。 その傷口に雑菌が入ってしまったらしくて性器の一部が壊疽していたわ。 命だけは助かったけど、当然もう子供は産めないし、あまりに大きなショックを受けたから精神障害がひどくて廃人になってしまったわ」 山本さんは非常に悲しそうでいて、悔しそうな表情をしながらその時の状景を振り返った。 1週間ほどその少女は「国境なき医師団」の診療所に入院していたそうだ。肉体的な治療が終了すると、少女は家族に連れられ家に戻っていった。虐殺の被害に遇った瀕死の患者が次々に運び込まれてくるため、生命の危機がなくなった患者を収容する場所がなかったためだ。 「悲しいけど、これ戦争なのよね」 山本さんは、苦しげに首を横に振りながら語った。
99 :デフォルトの名無しさん :2006/07/08(土) 09:12:04 .net >>97-98 よくあること はいりょしてくれないと
100 :デフォルトの名無しさん :2006/10/31(火) 17:47:09 .net >>1 64ビットユニコードつかえばいいだろ
101 :デフォルトの名無しさん :2006/11/09(木) 12:34:39 .net JISの文字コードがあれなのはそもそもが朝日新聞が適当に定めた文字だから
102 :デフォルトの名無しさん :2007/01/06(土) 11:43:23 .net まず文字コードについてだが、コード云々の前に自然言語の整理が必要だと思う。 実際にはほとんど使われることがない文字のためにコード領域を使うのは無駄だから そういう文字はどんどん淘汰してゆくべき。 あと、字体がそっくりな文字なんかもできるだけ1つに統合してしまったほうがいい。 そのあとで国(言語種別)ごとにコード領域を分けて、すべての文字を1つのコード体系に 収めるべき。 次に改行コードだが、全部LFで統一でOK。改行ごときに2バイトも必要ない。 既存のリソースは全部LFに変換してしまえばよい。 Windowsなんかでファイルの改行を勝手に変換する機能をサポートすれば、 CR+LFはいずれこの世から自然消滅するだろう。 最後にエンディアンについてだが、ビッグエンディアンに統一すべき。 人間が感覚的になじみやすいほうがいいから。 これらのことをやるにはそれなりの負担がかかるが、その結果得られるメリットを 考えたらすぐにでも取り掛かるべき。もちろん世界レベルで。
103 :デフォルトの名無しさん :2007/01/10(水) 13:15:10 .net バベルの塔で神の怒りに触れ文字コードの種類が沢山になった。 これは事実で、(ry
104 :デフォルトの名無しさん :2007/01/10(水) 14:26:08 .net JISとEUCはほぼ等価だから 漏れ的には扱い安さは EUC > JIS >>> SJIS >>>>>>> UNICODE だと思うよ
105 :デフォルトの名無しさん :2007/01/10(水) 14:28:45 .net 判定のしやすさで言えばJISは・・ UNICODEもそうだな、代わりにUTF-8とか使うが
106 :デフォルトの名無しさん :2007/01/10(水) 17:43:21 .net 援交ディングと門司セットの話がない交ぜに!
107 :デフォルトの名無しさん :2007/01/10(水) 18:11:17 .net UTF-128あれば大丈夫だろ?
108 :デフォルトの名無しさん :2007/01/10(水) 18:15:07 .net 野球板 お約束その122 「しまってこーぜー」 ↓ 「まずお前が社会の窓閉めろや」
109 :デフォルトの名無しさん :2007/01/10(水) 18:15:43 .net ミスッた
110 :デフォルトの名無しさん :2007/01/10(水) 20:06:46 .net 言語は何故複数あるのでしょうか? どうせなら言語も英語だけにしようよ。 パスがでたー
111 :デフォルトの名無しさん :2007/01/11(木) 09:38:18 .net 主食は何故複数あるのでしょうか? どうせなら主食も米だけにしようよ。
112 :デフォルトの名無しさん :2007/01/11(木) 23:46:02 .net >104 まさかとはおもうが、そのJISはCESとしてのISO-2022-JPの通称のことなのか? それともCCSとしてのJISX208なのか。
113 :デフォルトの名無しさん :2007/01/24(水) 23:51:46 .net だいたい文字をコード(数字)に置き換えなければならない 現代のコンピュータアーキテクチャが問題。 やっぱ文字は文字として扱えなきゃダメでしょ。
114 :デフォルトの名無しさん :2007/01/25(木) 09:34:43 .net 「文字を文字として扱う」っていうのは具体的にどういうことよ?
115 :デフォルトの名無しさん :2007/01/25(木) 10:01:33 .net 0から9、AからFまでの文字しか使わない
116 :デフォルトの名無しさん :2007/01/25(木) 11:25:11 .net で、それらの文字を文字として扱うとはどういうこと?
117 :デフォルトの名無しさん :2007/02/10(土) 22:58:13 .net あいう・・・と書かずに a01001a01002a01003・・・
118 :デフォルトの名無しさん :2007/03/16(金) 03:44:15 .net ベクトルデータとしてパターン認識させるとか?w
119 :デフォルトの名無しさん :2007/07/12(木) 19:45:19 .net 【日本語を扱える主な文字コード(“x-” 付きのものは IANA 非登録)】 Shift_JIS Windows-31J x-Mac-Japanese ISO-2022-JP ISO-2022-JP-2 x-CP50220 EUC-JP x-CP51932 UTF-8 x-UTF-8N x-UTF-8-BOM UTF-7 UTF-16 UTF-16BE UTF-16LE
120 :デフォルトの名無しさん :2007/07/12(木) 21:01:07 .net UTF-32系は?
121 :・∀・)っ-○◎● :2007/08/09(木) 02:10:09 .net UTF-9は?
122 :デフォルトの名無しさん :2007/08/09(木) 16:25:42 .net UTF-18は?
123 :デフォルトの名無しさん :2007/08/09(木) 23:52:07 .net Punycodeは?
124 :デフォルトの名無しさん :2007/08/13(月) 14:54:27 .net Windows上でperlのCGIを作成していて、 ファイルの保存時に、漢字コードを指定しないと 保存できないのですが、 シフトJISと JISと EUCと、 どれを選択したらいいのでしょうか? 作成後はFFFTPでレンタルサーバーにアップロードしますが、 そのレンタルサーバーは当然UNIXなので、 UNIXで動かすということを考えればEUCで保存したほうが いいのですか? あと、C5の問題(表とか)を考えれば シフトJISだと 表¥ っていちいち書かないと文字化けしますが、 EUCだったらそんな余計なこと考えないでいいと いう記述も見つけました。 だったらEUCで保存しようかな?と思いましたが それだとWindows上でソースコードの変更作業するときに 漢字が文字化けしないですか? だってWindowsはシフトJISしか取り扱えないのだから。 結局何で保存すればいいのでしょうか?
125 :デフォルトの名無しさん :2007/08/13(月) 23:34:09 .net >>124 ・ShiftJisで書いてffftpで変換する。 ・まともなエディタでEUCで書く。
126 :・∀・)っ-○◎● :2007/08/15(水) 03:02:00 .net UNIXだからってサイトをEUCにしないといけないなんてことはない。 最近のLinuxは標準文字コードはUTF-8が多いよ。 XML対応とかも視野に入れるならできればUTF-8のほうがいい。 Shift-JISはね、HTMLだけならいいけどプログラム書くと何かとトラブルに遭いやすい。
127 :デフォルトの名無しさん :2007/08/15(水) 03:08:05 .net そしてベンダ毎の変換表の違いやらのUnicode特有の問題になやまされるわけですね。 SJISでも機種依存文字とか、2バイト目に0x5C使ってるとか問題あるけど、 Unicode使っても薔薇色の未来が待ってるわけじゃない。 どっちかっつーと、長いものには巻かれろ的な感じの方が強い。
128 :デフォルトの名無しさん :2007/08/15(水) 10:36:44 .net ハナからUnicode使ってれば変換表とか関係ないんじゃ?
129 :・∀・)っ-○◎● :2007/08/15(水) 23:28:24 .net それは言える。 tDiaryでうかつにrecent-rssプラグイン使って2chのRSSを表示しようとすると 機種依存文字の関係でUNICODEの変換失敗で全部転ける。
130 :デフォルトの名無しさん :2007/08/16(木) 01:39:32 .net >>128 ハナからUnicodeしか使って無くても、WAVE DASH使うと Windowsのフォントでは汚くなるとかあるし無問題とはならない。
131 :デフォルトの名無しさん :2007/08/16(木) 05:24:15 .net 世界が今すぐに全てUnicodeに変るわけじゃないから、 >>128 は実現不可能な夢。 そもそも狂っている変換表があるから、 元の意味/意図と違うUnicodeのデータが溜っていっている状況。
132 :デフォルトの名無しさん :2007/08/16(木) 10:12:50 .net ダンゴさんの居るスレは活気があるな。
133 :デフォルトの名無しさん :2007/08/20(月) 17:54:12 .net 普通の日本語のサイトならEUC-JPかISO-2022-JPでいいだろ ちょいと外国の文字使うくらいなら実体参照でも十分だし Unicodeなんて混乱の極みにある物を使う気にはなれん
134 :デフォルトの名無しさん :2007/08/20(月) 20:15:12 .net なんでウェブサイトの話になってるの?
135 :デフォルトの名無しさん :2007/08/26(日) 08:04:08 .net あげ
136 :デフォルトの名無しさん :2007/08/30(木) 08:21:39 .net ネットワークが一番文字コード問題が露呈しやすいからだろ
137 :デフォルトの名無しさん :2007/09/02(日) 18:33:34 .net >>1 なんで人の言葉は複数あるんでしょうか?
138 :デフォルトの名無しさん :2007/09/04(火) 16:32:27 .net バベルの塔を建てたから
139 :デフォルトの名無しさん :2007/09/08(土) 10:08:44 .net JEFとかKEISとかその先にある厚生省系、労働省系の外字コードなんかがUnicodeに反映されていないってのがあるな
140 :デフォルトの名無しさん :2007/11/25(日) 16:28:52 .net JISの文字コード表なんて もうごちゃごちゃだな 80h〜9Fhなんて制御文字には使わないんだから 1区1点〜126区126点1つにまとめろよ
141 :デフォルトの名無しさん :2008/01/16(水) 23:18:53 .net >>135 あるよ。 以上。 ↓次の方どうぞ
142 :デフォルトの名無しさん :2008/05/07(水) 23:34:16 .net age
143 :デフォルトの名無しさん :2008/05/12(月) 22:00:30 .net sage
144 :デフォルトの名無しさん :2008/07/09(水) 23:50:48 .net 2208
145 :デフォルトの名無しさん :2008/12/23(火) 07:49:06 .net >>139 JEF KEIS IBM JIPS(E/J) これらの拡張も含めた文字は全てUTF-8で表現できるんじゃないの?
146 :デフォルトの名無しさん :2008/12/25(木) 21:09:50 .net プライベートエリアを私用領域とか訳しちゃうセンスが在る限り文字コードは増え続けるさ
147 :デフォルトの名無しさん :2009/01/07(水) 12:48:00 .net だれか文字コード総合スレの新スレ立ててー。
148 :デフォルトの名無しさん :2009/01/07(水) 21:23:47 .net >>147 前スレ、一ヶ月書き込みなくて17レスで落ちてるみたいだけど、需要ないからじゃね?
149 :デフォルトの名無しさん :2009/01/07(水) 21:31:34 .net この板、即死に引っ掛からなければ、数か月書き込みないのはざらなほう。
150 :デフォルトの名無しさん :2009/01/08(木) 00:03:07 .net >>147 ここを乗っ取ればいいんじゃね? >>148 誰もExt.Cには興味ないのか… Unicodeメーリングリストも絵文字で絶賛炎上中だしな
151 :デフォルトの名無しさん :2009/01/08(木) 22:13:20 .net >>149 ああ、即死食らったのか まぁ、このスレで充分な気もするけど
152 :デフォルトの名無しさん :2009/01/12(月) 16:41:43 .net http://www.unicode.org/mail-arch/unicode-ml/y2009-m01/0380.html 最近のUnicodeメーリングリストは顔が真っ赤で引くに引けなくなった人たちが たくさんいるようだがこれはひどすぎる 日本では「犬」を「ケン」と読むこともあるなんて知らないんだろうな。 それとも「いぬ」と読む「犬」と「ケン」と読む「犬」は別字だとか言い出すんだろうか。 それ何てKS X 1001?
153 :デフォルトの名無しさん :2009/01/12(月) 19:52:02 .net 文字コードって65000くらいあるの?
154 :デフォルトの名無しさん :2009/01/12(月) 21:00:14 .net 100万くらいあります
155 :デフォルトの名無しさん :2009/01/15(木) 00:13:07 .net 絵文字レビュー終了のお知らせ
156 :デフォルトの名無しさん :2009/01/18(日) 23:15:58 .net 国ごとに専用の(速度重視の)エンコーディング一つとUnicodeだけにしてほしい
157 :デフォルトの名無しさん :2009/01/18(日) 23:17:53 .net >>157 日本は何にするの?
158 :デフォルトの名無しさん :2009/01/26(月) 11:26:56 .net http://twitter.com/wraith13/status/1147555396
159 :デフォルトの名無しさん :2009/01/26(月) 12:52:12 .net >>157 JIS_X201で。
160 :デフォルトの名無しさん :2009/01/26(月) 23:24:33 .net http://smallbear.sakura.ne.jp/tron/btm20091.html#20090123 まるで人ごとのように書いてますけど TRONコードでは&T224C71;と&T224C72;のどっちなんですか? ていうか「&T224C71;と&T224C72;の区別すらできない欠陥規格だ!」式の批判は (JIS|Unicode)叩きの定番だったような気がするんですが。 ていうかTフォントマダー? (AAry
161 :デフォルトの名無しさん :2009/01/27(火) 01:10:46 .net 「…お母さん?俺やけど…」 「…TRONか?…」 「うん…俺、包摂分離してしもて…」 「もう、包摂分離の事は気にせんでいいから、成仏して…」
162 :デフォルトの名無しさん :2009/01/27(火) 08:05:57 .net ちなみに今昔文字鏡では*****(検閲削除されました)番と*****(検閲削除されました)番。 いや実際には調べてないけど絶対分離されてるに違いないし
163 :マイク ◆gZ6OoOjBU6 :2009/02/05(木) 08:39:33 .net UnicodeだかUTF16だか知らんが サロゲート文字の処理に関する脆弱性が色々なブラウザで報告されたりしてた。 2001年頃に2chで西村博之が誰かに指摘されてたウニコードに関する問題ってそれのことだったのかな。
164 :マイク ◆gZ6OoOjBU6 :2009/02/05(木) 08:49:15 .net これだわこれ。 blackhatコンファレンスで長谷川洋介って人だっけ? それが発表してた文字コードに関する脆弱性に関する論文に近いもの。 見てない奴は見てみ 参考になんぞ https://www.blackhat.com/presentations/bh-jp-08/bh-jp-08-Hasegawa/BlackHat-japan-08-Hasegawa-Char-Encoding.pdf
165 :デフォルトの名無しさん :2009/02/06(金) 15:04:05 .net Gmailが絵文字を全世界的に公式アナウンス。 https://mail.google.com/mail/help/about_whatsnew.html > Emoticons - they're not just for chat anymore > Express yourself with emoticons from to (小さい笑い顔) or (カニ) even (ハエうんこ). > Click the (小さい笑い顔) button when composing a message > in "Rich formatting" mode, or choose the new emoticons tab in chat, > and express yourself to your ハートマーク)'s desire. > Learn more (http://mail.google.com/support/bin/answer.py?hl=en&answer=112518) https://mail.google.com/mail/help/images/whatsnew/emoji_smile.gif を絵文字アイコンに決定した模様。 「even ハエうんこ」ワロタ
166 :デフォルトの名無しさん :2009/02/07(土) 08:19:39 .net Sun-ExtBが更新されて、Extension Cの正式版に対応してた。 >>165 それはちょっと前に話題になってたUnicode絵文字じゃなくてリッチテキスト方式かな
167 :デフォルトの名無しさん :2009/02/07(土) 09:20:45 .net UTF-16サロゲートペアをUTF-8に変換出来ますか?
168 :デフォルトの名無しさん :2009/02/07(土) 12:12:34 .net >>167 いったんUnicode scalar valueを求めてからUTF-8に変換してください。 サロゲートのコードポイント(D800..DFFF)をそのままUTF-8にするのは不正です。
169 :デフォルトの名無しさん :2009/02/08(日) 01:58:04 .net 日本人になまじ技術力があったから日本製PCが一時期国内でシェアを占め 独自のPC漢字文化が創られた。これがすべての始まり。
170 :デフォルトの名無しさん :2009/02/08(日) 13:24:01 .net で、ケータイの世界でもまったく同じようにガラパゴスケータイがシェアを占めて 独自の絵文字文化が発達したわけですね、わかります。 進歩しろよ
171 :デフォルトの名無しさん :2009/02/10(火) 11:08:47 .net 絵文字はユニコードに入りますよ、たぶん。
172 :デフォルトの名無しさん :2009/02/11(水) 01:08:00 .net 日本のケータイメーカーが音頭を取って入れたわけではないけどね。 漢字だってAdobeの活動でようやく異体字の使い分けが(原理上は)できるようになった
173 :デフォルトの名無しさん :2009/02/13(金) 07:51:40 .net http://www.kumikomi.net/article/report/2009/01tron/01.html > 2009年の早い時期に, もう出す出す詐欺はいいよ > 第1期 236,025字の一般リリース(Webからの無償ダウンロード)を予定しているという. GT78,675字×3書体を先に出すことにしたのか
174 :デフォルトの名無しさん :2009/02/17(火) 21:04:27 .net 久しぶりにSMPのroadmapを見たらU+1B100あたりに「(Historic Kana)」というのがあった。 http://www.unicode.org/roadmaps/smp/ 歴史的仮名遣いに必要な文字はすべて収録済みのはずだから 変体仮名の追加提案かな
175 :デフォルトの名無しさん :2009/02/17(火) 21:25:54 .net "historical"じゃないのは何故だろう?
176 :デフォルトの名無しさん :2009/02/17(火) 23:03:24 .net この前提案されてたKATAKANA LETTER ORIGINAL E(片仮名の元々のア行の「エ」、「衣」に由来)もそこに入るのかも知れない。 同時に提案されてたHIRAGANA LETTER YE(平仮名ヤ行の「え」、「江」に由来)は平仮名ブロックの空きの内の一つU+3097にほぼ決定みたいだが、 片仮名ブロックはもう空きが無いからな。
177 :デフォルトの名無しさん :2009/02/22(日) 18:58:47 .net http://fezn.exblog.jp/10234044/ 一太郎ってIVS対応してたの? マジ?
178 :デフォルトの名無しさん :2009/02/23(月) 23:33:42 .net > 今後は「出典をすべてscanデータで出すべし」という方針に。 > だが、律儀に守っているのは日本と中国ぐらい。。 > 未提出多数とか、「人名だから」出さずじまいとか、出典非明示→取り下げ、とか。 UCSがゴミまみれになるのを防ぐことに一定の効果を上げてるわけだな。いいことだ。
179 :デフォルトの名無しさん :2009/02/24(火) 15:45:03 .net >>177 今後の話だろ。
180 :デフォルトの名無しさん :2009/02/25(水) 22:50:21 .net 今後の話だったら「ブラウザはまだ」って書いてるのが変だ
181 :デフォルトの名無しさん :2009/03/03(火) 22:09:24 .net U+1B000がKATAKANA LETTER ARCHAIC E(片仮名「衣」由来のア行の「エ」)になってた。 名前がORIGINAL E(元々の「エ」)からARCHAIC E(古代の「エ」)に変更されてた。 平仮名ヤ行の「え」と違ってBMP外になってしまうけどしょうがないか。 Historic KanaというブロックでU+1B000から256文字分予約されたけど今後変体仮名とか重要な昔の仮名をU+1B001以降にも追加していくつもりなのかな?
182 :デフォルトの名無しさん :2009/03/04(水) 00:21:44 .net 256で足りるのw? そこら辺の文字はよく知らないけど512から1024くらいあってもいいような。
183 :デフォルトの名無しさん :2009/03/04(水) 00:29:59 .net 変体かなは良く分からないけど、ここのページを見る限り、平仮名だけでも軽く600以上ありそう。 ttp://www10.plala.or.jp/koin/koinhentaigana.html
184 :デフォルトの名無しさん :2009/03/04(水) 12:43:59 .net 住基仮名だけなら256で足りるがな。
185 :デフォルトの名無しさん :2009/03/05(木) 07:38:01 .net 1バイト目に文字種を表すもんだけいれて後は可変でよろしくやればいいと思った 最低2バイト〜な感じで
186 :デフォルトの名無しさん :2009/03/05(木) 17:50:02 .net 欧米人にはそれが理解できんのですよ。 たとえば、”うまれつき目の見えないひと” を想像してみてください。 その人に「海は青い」という事を、いったいどうやって教えればいいのか。 そのひとには、赤も青も黄色も無いんです。色という概念が全く無いんです。 だから理解不可能です。 3次元の世界で生活している我々が4次元の世界を理解できないのと同じく 1文字1バイト圏で生活している欧米人には、1文字が2バイト、3バイトになるのが 理解できんのです。ヤツらにとってマルチバイト文化は4次元の世界なのです。
187 :デフォルトの名無しさん :2009/03/05(木) 18:06:53 .net 物理的に無理なのと一緒にされても。
188 :デフォルトの名無しさん :2009/03/05(木) 19:19:15 .net 文字コード総合の次スレはここでござるな? しからば過去スレを貼り。 【UTF8】文字コード変換【SJIS】 http://pc5.2ch.net/test/read.cgi/tech/1063177450/ 文字コード統一スレ 1文字目 http://pc8.2ch.net/test/read.cgi/tech/1109171258/ 文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/ 文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
189 :デフォルトの名無しさん :2009/03/05(木) 20:24:38 .net >>185 いきなり可変でよろしくやってるのがUTF-8です。
190 :デフォルトの名無しさん :2009/03/05(木) 21:44:14 .net >>184 たとえば「安」から「あ」へ連続的に変化していく過程の文字の数々にどうやって包摂規準を 設定するのか、とか考えると住基仮名のようなclosed setしかありえない気がする
191 :デフォルトの名無しさん :2009/03/07(土) 02:01:46 .net 変体でも「あ」なら「あ」なのだから、「あ」に対して異体字セレクタの対応を決めればいいだけなんじゃね? 256種類まで対応できるんだから、多分足りるでしょ。 足りなきゃ、異体字セレクタの方を増やせばいい。
192 :デフォルトの名無しさん :2009/03/07(土) 14:29:53 .net U+E0100〜U+E01EFは漢字専用じゃなかったっけ?
193 :デフォルトの名無しさん :2009/03/07(土) 15:36:34 .net それよりアラビア文字みたいに前後の文字で字形を変えるのを サポートする必要があるんじゃないか
194 :デフォルトの名無しさん :2009/03/07(土) 19:27:11 .net ・縦書き ・前後の状況で字形を変える必要がある ・異体字セレクタに対応が必要 それなんてモンゴル文字?
195 :デフォルトの名無しさん :2009/03/07(土) 22:28:59 .net 草書を標準化するところから始めないと…
196 :デフォルトの名無しさん :2009/03/08(日) 11:10:41 .net アラビア文字がまさに草書の電子化
197 :デフォルトの名無しさん :2009/03/09(月) 02:11:40 .net 文字コード総合スレ part5 http://pc11.2ch.net/test/read.cgi/tech/1236529563/l50 作ってきた。 即死回避に、だれか頼む。 あと、テンプレがまだ(40行)残ってるので。現在連投規制(5回)で書き込めないのを何とかしないといけない。
198 :デフォルトの名無しさん :2009/03/09(月) 02:23:53 .net ●かえ
199 :デフォルトの名無しさん :2009/03/09(月) 02:36:52 .net ●持ってない 取り合えず見切り発車してくれ。
200 :デフォルトの名無しさん :2009/03/09(月) 22:10:13 .net >>197 乙 どんだけ書けば即死回避するんだっけ
201 :デフォルトの名無しさん :2009/03/23(月) 19:29:17 .net >>192 あれって漢字専用なの? 漢字とモンゴル文字以外の場合はU+FE00〜FE0Fを使わないといかんの?
202 :デフォルトの名無しさん :2009/08/11(火) 15:28:27 .net ∧_∧ ( ・∀・ )つ ( つ / | (⌒)どどど・・・ . し' 三 ∧_∧ ⊂( ・∀・ ) . ヽ ⊂ ) (⌒) |どどどどど・・・・・ 三 `J メ\,_ ,メ゙\、 .メ′ .゙゙アhr _,zl||y,_ .゙∨ .″ .y!^⌒ ¨\ .,,,,,,__ .,yr=¬z .l| ◎ 《 . ゙゙̄^へu, ,メ″,z厂◎ l| ¥ il! ゙ミ il「 ミy ..,ilト ゙ミy_ ア ,メ .∨ .ll′ 干=冖″ ,,,yyyyy. l| / ̄ ̄ ̄ ̄ ̄ .l| ,,,yvr=冖''''|リ|||》巛》ミ冖'li厂.l| .,l! < 薄型?!!! .l! 《vvvr=冖¨ ̄ .゙干l! .,メ′ \_____ .l| .l| .,,yrrvy_ ,,,,,,_ .《yrl″ \_ ,l|.,yzl^^゙゙^冖《《||7厂`゙リu_ .l| .゙\、 .r《l厂 .¨゙冖=vu,フhrト
203 :デフォルトの名無しさん :2009/12/12(土) 15:53:19 .net >>1 日本が世界を統一できなかったから
204 :デフォルトの名無しさん :2009/12/12(土) 18:36:49 .net >>47 むしろNTはいち早く海栗コードだっただろ 当時は処理コストの無駄とすら言われていた。
205 :デフォルトの名無しさん :2010/04/08(木) 01:34:54 .net もし、織田信長が生きていたら、日本が世界を支配するとか、テレビってマジ、アホだな。 あそこに出てた専門家も恥ずかしくないんだろうか? (ひょっとして自称専門家かな)
206 :デフォルトの名無しさん :2010/06/27(日) 00:46:08 .net UTF8最強 ASCIIとの互換性は伊達じゃない。
207 :デフォルトの名無しさん :2010/06/27(日) 00:57:46 .net もし、織田信長が生きていたら、日本が世界を支配
208 :デフォルトの名無しさん :2010/06/30(水) 13:16:56 .net 立ってないことろを見ると、ここが「文字コード総合スレ」の後継スレでつか?
209 :デフォルトの名無しさん :2010/06/30(水) 13:28:51 .net 立てるか。 テンプレ面倒過ぎるな。1 だけでいい?
210 :デフォルトの名無しさん :2010/06/30(水) 23:13:43 .net VSネタまだやるなら分けてほしいな
211 :デフォルトの名無しさん :2010/07/02(金) 17:37:12 .net 結局争点はなんだったのだろう?
212 :デフォルトの名無しさん :2010/07/02(金) 23:59:40 .net >>211 俺、utf8非万能説についてた人だが、俺の争点はそこだったんだが、相手の争点はそこじゃなかった気がするんだ。 一体何が争点だったのか、当事者にも分からない。
213 :デフォルトの名無しさん :2010/07/03(土) 00:50:32 .net >>211 もおたが飲み仲間なのか、それとも憎いかでしょう。
214 :デフォルトの名無しさん :2010/07/03(土) 11:01:09 .net それじゃ、争点を洗い出すスレが別に要る?それともここがそれ?
215 :デフォルトの名無しさん :2010/07/03(土) 11:02:48 .net >>214 もういらないだろ。
216 :デフォルトの名無しさん :2010/07/03(土) 11:55:19 .net 文字コードのスレは何故複数あるのでしょうか?
217 :デフォルトの名無しさん :2010/07/03(土) 11:57:49 .net コードもスレも統合出来ないお馬鹿さんたちwww
218 :デフォルトの名無しさん :2010/07/03(土) 12:18:09 .net 馬鹿が来たぞー
219 :デフォルトの名無しさん :2010/07/03(土) 12:41:21 .net >>211 争点は、UTF8はUTF16やUTF32よりも優れている。 特にASCIIとの互換性に優れており、 既存のソフト・・・多くはASCIIやEUC-JPなどの ASCII互換用として作られているソフトや そこで使われているライブラリの互換性がよく ほとんど修正無しに動く。 UTF16やUTF32だと修正のコストが膨大になる。 ということ。
220 :デフォルトの名無しさん :2010/07/03(土) 12:52:08 .net wchar_tとロケールとファイルシステム(fopen)がごっちゃになってた気がするんだが。
221 :デフォルトの名無しさん :2010/07/03(土) 13:01:26 .net 全部charをwchar_tに置き換えるだけでOKとかいう 能天気やろうもいたしな。 それが全ソースコード修正&再テストという 意味だというのを気づいていない。 その膨大さに気づいていないから、 置き換えるだけにコストがかかるというんですか? なんてことを平気でいえてしまう。
222 :デフォルトの名無しさん :2010/07/03(土) 13:06:11 .net >>219 それは争点じゃなくて、君の意見。 そしてUTF16,UTF32に拘りすぎ。 それを最初に持ち出した人(同一人物かは知らんが)は、 UTF8でも修正コストが膨大だと主張していて、UTF16は別にどうでもいい感じだった。 >>220 その通り。ファイルシステムどころかOSの仕様まで混ざってきて、複雑になるばかりの泥仕合。
223 :デフォルトの名無しさん :2010/07/03(土) 13:07:21 .net >>222 お前の意見も、「君の意見」でしかないよ。 鏡見ろ
224 :デフォルトの名無しさん :2010/07/03(土) 13:07:38 .net >>221 置き換えずにそのまま使うのにコストがかかるんですか?というのと同レベルの話。
225 :デフォルトの名無しさん :2010/07/03(土) 13:08:47 .net >>223 俺は争点について話してない。>>219 は争点について話しているはずなのに、君の意見しか入ってない。 自分の考え方に囚われるな。
226 :デフォルトの名無しさん :2010/07/03(土) 13:10:12 .net >>222 文字コードを変えるのにOSの仕様まで出てくるってこと自体が、 文字コード変えるのがいかに難しいかを示しているんだけどなぁ。
227 :デフォルトの名無しさん :2010/07/03(土) 13:17:19 .net この話は続ける必要はない。落ちたスレで既に話は終わっていたのだから。 999 名前:デフォルトの名無しさん [sage]: 2010/06/26(土) 22:19:28 >>972 >UTF-8にすると何もかも上手くいくよ派は、何を言いたいのかよくわからん そんな奴いたか? wchar_tにすれば何もかもうまくいくよ派は居たけど。 --- UTF-8にすると何もかも上手くいくよ派がいないのなら、 >>212 が争点にしてたことは、元々誰も否定してなかったことだし、 >>219 が争点にしてたことは、元々誰も言っていなかったこと。 wchar_tにすることが全てを解決する方法じゃないのは自明。 結論は既に出ていた。
228 :デフォルトの名無しさん :2010/07/03(土) 13:25:04 .net >>219 が争点にしてたことは、元々誰も言っていなかったこと。 言っていたレスはあった
229 :デフォルトの名無しさん :2010/07/03(土) 13:30:08 .net じゃあここは「文字コード総合スレ」がなぜ立たないのか、立てた場合のテンプレの話のスレにする?
230 :デフォルトの名無しさん :2010/07/03(土) 13:38:28 .net なにもなければ放置されるだけのスレの埋め草としてちょうどいいな。
231 :デフォルトの名無しさん :2010/07/03(土) 14:35:47 .net >>228 それよりも俺はwchar_tにすれば何もかもうまくいくよ派がいたのかどうかが気になるが。 >>229 いらないからだろ。
232 :デフォルトの名無しさん :2010/07/03(土) 14:58:57 .net さっさと次スレ立てろよボケ
233 :デフォルトの名無しさん :2010/07/03(土) 15:13:49 .net >>231 > >>228 > それよりも俺はwchar_tにすれば何もかもうまくいくよ派がいたのかどうかが気になるが。 > WindowsかJavaしか知らなくて、Unixのロケールを知らなければそういう発想になるかも。
234 :デフォルトの名無しさん :2010/07/03(土) 15:21:57 .net >>233 意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ?
235 :デフォルトの名無しさん :2010/07/03(土) 15:24:04 .net 情報の受け手側に理解する能力がなければ書かれてても気付かないってことだろう
236 :デフォルトの名無しさん :2010/07/03(土) 15:26:22 .net >>234 > >>233 > 意味が分からん。2chに書いてあったか書いてなかったかと、Unixのロケールがどう関係するんだ? fopenのwchar_tは規格化されていない、から泥仕合が始まったのだが。
237 :デフォルトの名無しさん :2010/07/03(土) 15:28:13 .net 知らないことは誰だってあるけど、いいやんとか言って違いも調べず思考停止するやつは向上心もう少し持とうぜ
238 :デフォルトの名無しさん :2010/07/03(土) 15:43:18 .net >>236 ・fopenの話が出たことと、wchar_tにすれば何もかもうまくいくという人がいたことは関係がない ・fopenが出てくる前から、どうせ泥試合だった ・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ と認識しているが。
239 :デフォルトの名無しさん :2010/07/03(土) 16:01:26 .net > ・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ > と認識しているが。 ロケール間違ったまま使っていることなんてしょっちゅうあるが? 日本語化しないままOS使えるだろ。 文字がちゃんと表示されないだけで
240 :デフォルトの名無しさん :2010/07/03(土) 17:02:38 .net Linuxのext2,ext3でSJIS,EUC-JP,UTF-8のファイル名混在は時々ある。 LinuxでもCD-ROM,vfat,ntfs,smbfsをマウントできて、その時に文字コードを指定しないと痛い目にあう。
241 :デフォルトの名無しさん :2010/07/03(土) 17:47:51 .net >>239 日本語使えるロケールでも日本語がちゃんと表示されないんだったら、それは正常に動作してるとは言わない。 たとえ内部的にはちゃんと保持できていたとしても、関係ない。 >>240 それぞれのパーティションごとに文字コードが違うのは指定すればいいけど、 同一パーティションに複数の文字コードが混在してるのはやめてほしいが……
242 :デフォルトの名無しさん :2010/07/03(土) 18:27:39 .net LANG=Cでもきちんと表示できなかったらだめだって言い切っちゃうの?
243 :デフォルトの名無しさん :2010/07/03(土) 19:37:56 .net >>242 それは日本語使えるロケールじゃないだろ。
244 :デフォルトの名無しさん :2010/07/03(土) 19:41:28 .net つか、例えば仕様書に「ロケールはja_JP.eucjp」って明記してあっても、 utf8で書いてもなんにも問題はないからutf8で書いて、 utf8なら問題なくfopen使えるからutf8でfopen使って、 結果、表示が文字化けしていても、utf8なら問題なく読めるから問題ないって言いきるつもりなのか? 内部的にはutf8使ってもいいけど、必要に応じて変換しないとダメなんじゃないの。
245 :デフォルトの名無しさん :2010/07/03(土) 19:44:47 .net >>241 表示が化けるのはあくまで端末側の問題。 fopen自体はロケール関係なく正常に動作している。 まったく同じコードでね。 UTF8がASCII互換だからちゃんと動く。
246 :デフォルトの名無しさん :2010/07/03(土) 19:52:48 .net 「日本語が使える」の定義が知りたい。
247 :デフォルトの名無しさん :2010/07/03(土) 20:34:28 .net >>245 ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか? 日本語ロケールでUIが全部韓国語になるのと同じくらい馬鹿げてると思うぞ。
248 :デフォルトの名無しさん :2010/07/03(土) 20:38:42 .net >>238 >・どっちにせよ、fopenでそのままutf8渡して(文字化けすらしないという意味で)うまくいくのはロケールもutf8のときのみ >と認識しているが。 それはそうだけど、fopenの機能としてはちゃんと動作するよね。 wchar_tの渡した場合、fopenが正しく機能しない・・・というか渡せない つまりfopenでは動作しない どちらもうまく動いてないといえるけど、その動かない箇所のレイヤーが違うんだよね。 それを同じ土俵で較べ合ってもしょうがないと思うんだが。
249 :デフォルトの名無しさん :2010/07/03(土) 20:52:48 .net >>248 1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩 2. wchar_tでもcharでも意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけないという点で同じ 3. なんでそんなにwchar_tに拘ってるの? >>227 > wchar_tにすることが全てを解決する方法じゃないのは自明。 >>231 > それよりも俺はwchar_tにすれば何もかもうまくいくよ派がいたのかどうかが気になるが。
250 :デフォルトの名無しさん :2010/07/03(土) 20:59:31 .net > 2. wchar_tでもcharでも意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけないという点で同じ 意図したとおりの結果にするには表示するときにデータを整えれば良いだけの話。 それはfopenには関係ない話。
251 :デフォルトの名無しさん :2010/07/03(土) 21:01:10 .net >>247 > ロケールがEUC-JPなのにファイルをUTF8で書き込むのは正常動作って言えるのか? 普通にロケールがEUC-JPだけど、 UTF-8のファイルを読み書きしたり データベースがUTF-8だったりするけど? 何を言いたいのかさっぱりわからん。
252 :デフォルトの名無しさん :2010/07/03(土) 21:03:28 .net fopen(3)はNULLを返さなければ、open(2)は-1を返さなければ正常。
253 :デフォルトの名無しさん :2010/07/03(土) 21:26:40 .net 内部的にはutf8使う香具師なんているのか
254 :デフォルトの名無しさん :2010/07/03(土) 21:28:50 .net なぜ内部にこだわる?
255 :デフォルトの名無しさん :2010/07/03(土) 21:29:09 .net >>253 > 内部的にはutf8使う香具師なんているのか Gtk+
256 :デフォルトの名無しさん :2010/07/03(土) 21:36:31 .net GTKは糞
257 :デフォルトの名無しさん :2010/07/03(土) 21:47:40 .net wchar_tが2バイト4バイト、エンディアンの違いを考えると、 gtkの内部utf-8はマルチプラットフォームって意味では合理的だと思うが。
258 :デフォルトの名無しさん :2010/07/03(土) 22:45:00 .net >>249 >1. 意図した通りの結果にならないのなら、どこで失敗しても五十歩百歩 結果で見ればそうだけど、ここはプログラム板。 システムで採用されているロケールの文字を使う限り文字化けはしないわけでしょ。 ASCIIでもShift_JISでもUTF-8でも。 それらに対してprintfはそのまんま使える汎用性がある。 wchar_tの場合は、そこまで汎用性が持たせられない。というかそこまで汎用的に 使える標準関数が整備されていない。 その違いによる(プラットフォーム間の移植などで)発生するコストをどう捉えるかの 問題じゃないの?
259 :デフォルトの名無しさん :2010/07/03(土) 23:17:42 .net ばかっ。 wchar_tとか不用意に持ち出すと今度はCSI vs UCS Normalizationで不毛な戦火の拡大が……
260 :デフォルトの名無しさん :2010/07/03(土) 23:33:30 .net >>250 eucjpロケールの環境で、ファイル名も全部eucjpで保存されてるのに、どっかの誰かがお構いなしにutf8で書いて文字化けしたら、 その人のためにわざわざlsをeucjpとutf8混在しててもちゃんと使えるように書き換えろって言うの? > 結果で見ればそうだけど、ここはプログラム板。 関係がない。どこの板でも、表示上文字化けするかしないかは重要な基準。
261 :247 :2010/07/03(土) 23:36:12 .net utf8の利点言いたい人がfopenなんて持ち出したのが間違いとしか思えない。 むしろ、俺ならそこに触れないわ。 >>251 ごめんよー、ファイル名の間違いだわ。
262 :デフォルトの名無しさん :2010/07/03(土) 23:37:59 .net >>260 文字化けするが書けるだろう? それは違う文字コードでちゃんと書けていることを意味するんだよ。
263 :デフォルトの名無しさん :2010/07/03(土) 23:38:59 .net >>258 >>249 の2.には異論ないのかな? だったら、 fopenがそのまんま使えるには使えるけれども、意図した通りの結果にしたければ、一旦ロケールに合わせて変換しないといけない が結論なわけだな。
264 :デフォルトの名無しさん :2010/07/03(土) 23:41:19 .net >>262 それでいいんだったら、utf8自体いらない。 UTF16をbase64エンコーディングしたらASCIIだけで事足りるんだから。
265 :デフォルトの名無しさん :2010/07/03(土) 23:42:31 .net 意図した通りってなんだよ。 ファイル名が「テスト」だとしてEUC-JPで書き込んだ場合と UTF-8で書き込んだ場合、文字コードが違うのだから それをあらわすバイナリ列も違う。 だから違うファイル名として扱うのが意図した動作だが? 逆に言えば、fopenはバイナリ列しか見ておらず それがEUC-JPかUTF-8なのかは気にしていない。 わざわざ文字コードを変換する機能を入れるのが意図した動作だと?
266 :デフォルトの名無しさん :2010/07/03(土) 23:46:45 .net >>265 そしたら、君は何のためにファイル名に非ASCII文字を使うの?
267 :デフォルトの名無しさん :2010/07/03(土) 23:50:03 .net 酷い流れだ。もう結論これでいい? 表示上文字化けしないようにファイル作りたかったら、文字コード変換しろ。 表示上文字化けしてもバイナリ列が保存されていればどうでもいいなら、utf8使っても構わん。
268 :デフォルトの名無しさん :2010/07/03(土) 23:52:27 .net >>266 何のためにじゃなくて、Unixでは'/'と'\0'以外パス名に制限が無いから、 それ以外何を使っても良い、でしょ。
269 :デフォルトの名無しさん :2010/07/03(土) 23:55:05 .net >>268 何使ってもいいけど、そんなキーボードで入力しにくいファイル名使って何がしたいの?
270 :デフォルトの名無しさん :2010/07/03(土) 23:55:48 .net >>268 じゃあ、Windowsじゃutf8でfopenは残念なことになるって思っていい?
271 :デフォルトの名無しさん :2010/07/04(日) 00:05:25 .net >>270 cygwin
272 :デフォルトの名無しさん :2010/07/04(日) 00:12:23 .net >>269 確かにウムラウトとか入力しずらいね。
273 :デフォルトの名無しさん :2010/07/04(日) 00:17:36 .net >>270 はい。残念なことになっています。 fopenはワイド文字を扱う場合は、_wfopenを使うようにと 一時期は使えない関数とされ、今は一応使えるようになりましたが、 標準を満たしていない独自の引数をとるようになりました。 もはや互換性の無い別物です。
274 :デフォルトの名無しさん :2010/07/04(日) 00:33:55 .net >>272 うん。表示に拘らないのなら、半角英数だけで事足りる。ドットくらいは使うかもしれんが。 実際、人が読む必要がないキャッシュファイルやら一時ファイルはそういう風な名付け方になってることが多い気がする。
275 :デフォルトの名無しさん :2010/07/04(日) 00:34:16 .net WindowsでfopenでUNICODE文字列のファイル名って開けるのか?
276 :デフォルトの名無しさん :2010/07/04(日) 00:36:42 .net http://www.game-create.com/archives/320 > > よく使う標準関数の UNICODE 対応表を作ってみました。 > > Windows では UNICODE 対応時と UNICODE 未対応時で > 呼び出す関数を振り分ける必要がありますが、 _t で始まる > 標準関数を使っておくことで、コンパイル時に自動的に関数を振り分けることができます。 あー、これは残念だw
277 :デフォルトの名無しさん :2010/07/04(日) 00:41:32 .net TCHAR 型ってwww http://www.ruche-home.net/?%A5%D7%A5%ED%A5%B0%A5%E9%A5%DF%A5%F3%A5%B0%2F%BE%AE%A5%CD%A5%BF%BD%B8%2FUnicode%C2%D0%B1%FE%A5%B3%A1%BC%A5%C7%A5%A3%A5%F3%A5%B0
278 :デフォルトの名無しさん :2010/07/04(日) 00:52:11 .net >>275 言葉自体が曖昧。 まず、Windowsは内部ではファイル名をutf-16で管理してる。 そして、fopenは実装依存。とりあえずVC++のfopenで、日本語ロケールでの使用を想定する。 つまりfopenはcp932(sjisのMS拡張と思ってよし)でエンコードされたchar*をとって、内部でutf-16に変換してる。 そういう意味で、全ファイル名がUNICODE文字列であって、fopenではcp932を経由してUNICODE文字列のファイル名を開ける、と言える。 あるいは、cp932入れるべきところに強引にUNICODE文字列をねじこんで、 それをWindowsが内部でcp932のつもりでutf-16に変換したもの、という意味なら。 まず、それがファイル名として妥当なものになるのか(つまり、そんなファイル作れない。ないものは読めない)というのがひとつ。 次に、UNICODE文字列とはutf8か16か32か(あるいは7か...)。 16,32ならNULを含むことになって作れないだろうなぁ。 8なら、sjisのバックスラッシュ問題にコンパイラが対応してるか、ユーザが小細工してるか。 それによって別の文字になるので調整しないといけないが、うまくすれば読める。
279 :デフォルトの名無しさん :2010/07/04(日) 00:52:15 .net >>270 CP_UTF8ってのがあるよ。
280 :デフォルトの名無しさん :2010/07/04(日) 01:02:09 .net >>278 なんでファイル名にUNICODE使えるのかの話で cp932を持ち出してるの?
281 :デフォルトの名無しさん :2010/07/04(日) 01:09:25 .net WindowsではfopenにASCII非互換のSJISなどを 認めてしまったため、ASCII互換のものならなんでも受け付けられる なんて変更は出来なかった。 そのためUNICODEに対応するには、fopenではない 別の関数を使うしかない。それが_wfopen(MS独自関数)ただし これはUNICODE(UTF-16)限定のためWin9xでは動かない。 そのために_tfopenというマクロが作られた。これを使っていると define定数でfopen、_wfopenどちらを使うか自動的に変更できる。 これは関数だけではなく、文字列も一緒で、L”文字列"なんて書き方をすると 自動的に変換してくれるがなんか_Tマクロとか_TEXTマクロとかいろいろあって 誰か、きれいにまとめて書いてくれ。 めちゃくちゃすぎてわからん。あぁ、fopenだけでUTF-8で もEUC-JPにもなんにでも対応できるLinux楽だよ。
282 :デフォルトの名無しさん :2010/07/04(日) 01:54:02 .net >>280 >>278 を読んだのにその疑問が沸いたのなら、君でも分かるように説明するのはあまりに面倒だ。 >>281 で、Linuxに関しては>>267 でいいの? あと>>274 にも異論は無い?
283 :デフォルトの名無しさん :2010/07/04(日) 07:56:21 .net _Tマクロとか_TEXTマクロとかWindowsのマクロの種類は何故複数あるのでしょうか?
284 :デフォルトの名無しさん :2010/07/04(日) 12:58:15 .net TEXT("hoge") もあったな
285 :デフォルトの名無しさん :2010/07/04(日) 13:23:16 .net 文字コード処理の種類はCSI方式とUCS normalization方式と何故複数あるのでしょうか?
286 :デフォルトの名無しさん :2010/07/04(日) 14:37:25 .net それは対になるものなのか?
287 :デフォルトの名無しさん :2010/07/06(火) 12:42:48 .net 文字コードのスレは何故複数あるのでしょうか?
288 :デフォルトの名無しさん :2010/07/06(火) 14:36:35 .net あっちがうさげならばこっちはよそ?
289 :デフォルトの名無しさん :2010/07/08(木) 13:59:28 .net インテリジェント昆布 略して iconv
290 :デフォルトの名無しさん :2010/07/12(月) 21:33:35 .net 文字コード総合スレ part6 http://pc12.2ch.net/test/read.cgi/tech/1278923059/
291 :デフォルトの名無しさん :2010/07/14(水) 01:22:05 .net 文字の種類は何故複数あるのでしょうか?
292 :デフォルトの名無しさん :2010/07/14(水) 01:50:03 .net ローマ字では日本語を読みにくいからじゃないかしら
293 :デフォルトの名無しさん :2010/07/14(水) 04:59:56 .net 世界は広いからだよ
294 :デフォルトの名無しさん :2010/07/14(水) 05:46:37 .net バベルの塔を作り始めたからです
295 :デフォルトの名無しさん :2010/07/15(木) 20:19:48 .net 肉フライ 略してnkf
296 :デフォルトの名無しさん :2010/07/16(金) 01:00:45 .net >>295 正式にはnettowa-ku kanji firuta-の略だっけ。
297 :デフォルトの名無しさん :2010/07/16(金) 02:24:52 .net nurupo kimuchi-E fack
298 :デフォルトの名無しさん :2010/07/16(金) 16:06:16 .net >>296 nkf Network Kanji Filter http://sourceforge.jp/projects/nkf/ まさかのgit。 http://git.sourceforge.jp/view?p=nkf/nkf.git
299 :デフォルトの名無しさん :2010/07/30(金) 16:49:09 .net ワロタ 本になっていたのね。 斎藤秀紀「構造化4バイトコードによる多言語漢字の符号化」 http://www.amazon.co.jp/gp/product/4898273009/ これでしょ。 http://www.horagai.com/www/moji/int/saito.htm
300 :デフォルトの名無しさん :2010/07/30(金) 20:17:12 .net >>299 ここも隔離スレっぽいよ。
301 :デフォルトの名無しさん :2010/08/05(木) 08:30:33 .net コードの種類は何故複数あるのでしょうか? ストレートとクロスの見分けが付きません。
302 :デフォルトの名無しさん :2010/08/05(木) 09:06:26 .net ソースといえばブルドック?おたふく? あなたはどちら?
303 :デフォルトの名無しさん :2010/08/05(木) 09:06:55 .net 買ったらすぐにシール貼っとけよ
304 :デフォルトの名無しさん :2010/08/05(木) 20:29:23 .net >>301 両端のコネクタを並べてみて、色が同じ順ならストレート、違う順ならクロス。
305 :デフォルトの名無しさん :2010/08/10(火) 12:56:48 .net >>302 イカリソース
306 :デフォルトの名無しさん :2010/09/12(日) 08:49:08 .net >>302 カゴメ
307 :デフォルトの名無しさん :2010/09/12(日) 11:38:54 .net >>302 中部地方はコーミソースに決まってんだよ。ブルドッグ何それ。
308 :デフォルトの名無しさん :2010/09/12(日) 11:49:50 .net 俺のホワイトソースでも飲んでろ 馬鹿どもめ
309 :デフォルトの名無しさん :2010/09/13(月) 07:34:49 .net ソースの種類は何故複数あるのでしょうか? ソースを買ってくるように頼まれてソイソースを買ってきたら怒られました。
310 :デフォルトの名無しさん :2010/09/13(月) 16:04:42 .net そりゃ醤油はソースとは認められないからな。 次はちゃんとソースを買ってくるんだぞ。
311 :デフォルトの名無しさん :2010/09/13(月) 16:38:52 .net >>283 自分用メモ WindowsSDKレベルではではTCHARとTEXTか__TEXTのみ有効 その他はCランタイムのもので混用すべきではない
312 :デフォルトの名無しさん :2010/09/13(月) 22:48:14 .net UNICODEがSDK用で_UNICODEがCRT用だっけ
313 :デフォルトの名無しさん :2010/09/13(月) 23:10:52 .net L()はどれだっけ
314 :デフォルトの名無しさん :2010/09/13(月) 23:24:28 .net そんなマクロあったっけ
315 :デフォルトの名無しさん :2010/09/14(火) 01:03:17 .net L""ならリテラルじゃね
316 :デフォルトの名無しさん :2010/09/14(火) 07:45:04 .net それは言語機能でMSは関係ないな もっともMS以外ではワイド文字がUTF-16とは限らないけど
317 :デフォルトの名無しさん :2010/09/25(土) 17:10:40 .net もっとも、 <windows.h>の中のどこかのヘッダで以下のような旨の記述があり、 「_UNICODEとUNICODEのどちらか一方は定義してあるけど、もう片方は定義されていない」 という状況を排除しているので、_TとTEXTを混在させても問題ない。 #ifdef UNICODE #ifndef _UNICODE #define _UNICODE #endif #endif #ifdef _UNICODE #ifndef UNICODE #define UNICODE #endif #endif
318 :デフォルトの名無しさん :2010/10/09(土) 19:23:25 .net >>302 どろソース
319 :デフォルトの名無しさん :2011/01/16(日) 14:27:02 .net そーすね
320 :デフォルトの名無しさん :2011/04/15(金) 13:28:40.29 .net >>302 オリバー
321 :デフォルトの名無しさん :2011/04/15(金) 15:28:09.44 .net >>302 イカリが多かったがカープも使う
322 :デフォルトの名無しさん :2011/04/15(金) 21:32:56.00 .net CP932の完成度は異常。
323 :デフォルトの名無しさん :2011/04/15(金) 22:39:01.54 .net 同じ文字でコードが何種類もあるものが完全とな。
324 :デフォルトの名無しさん :2011/04/15(金) 22:53:48.86 .net スレ全体検索したけど完全なんて文字は>>323 しかない件
325 :森& ◆vjMeDi2lEM :2011/06/24(金) 00:06:15.57 .net 森鴎外の「鴎」は正しくは「鷗」である。 草なぎ剛 草g剛 北朝鮮に文字コードは割り振られているのか? マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと 懇願されたが拒否したらしいが。直接北から要求しなかった。 北は南と文字が異なっているのか。 unicodeに北文字あったか?存在するなら規格票、文献を提示してくれ。
326 :uy ◆hi.ht/Isu2 :2011/06/29(水) 06:19:43.43 .net >マイクロソフトは、南朝鮮の町工場に北の象形文字をOSに実装してくれと >懇願されたが拒否したらしいが。直接北から要求しなかった。 >北は南と文字が異なっているのか。 日本語勉強しろよゴミカスが マジでゴミなんだな
327 :デフォルトの名無しさん :2011/10/25(火) 22:25:08.62 .net ∩___∩ | ノ ヽ / ● ● | | ( _●_) ミ 彡、 丶 ノ 、` / __/ ⌒`\/⌒/ (___) . / ( ) | ⌒`\//⌒ 入_ へ \_ へ \_ @三三三三 (____)三(____)三三)
328 :デフォルトの名無しさん :2011/10/25(火) 22:39:19.15 .net >>325 金正日を意味する特殊な文字が追加されてるらしいんだな。漢字で言うと「朕」みたいなもんだろ。
329 :デフォルトの名無しさん :2011/10/25(火) 23:00:40.79 .net 斎藤、斉藤、齋藤、齊藤 おまえら少しは反省しろ
330 :デフォルトの名無しさん :2011/10/26(水) 00:03:12.66 .net 「そ」を1筆で書くのか2筆で書くのかくらいの違いはある
331 :デフォルトの名無しさん :2011/10/26(水) 14:40:03.49 .net >>329 何を?
332 :デフォルトの名無しさん :2011/10/27(木) 04:55:47.65 .net 山崎、山嵜、山ア やまざき? やまさき?
333 :デフォルトの名無しさん :2011/10/30(日) 10:23:28.18 .net ∧_∧ ピュー ( ^^ ) <これからも山崎を応援して下さいね(^^)。 =〔~∪ ̄ ̄〕 = ◎――◎ 山崎渉
334 :デフォルトの名無しさん :2011/12/13(火) 16:57:33.87 .net __∧_∧_ |( ^^ )| <寝るぽ(^^) |\⌒⌒⌒\ \ |⌒⌒⌒~| 山崎渉
335 :デフォルトの名無しさん :2011/12/13(火) 18:21:01.09 .net >>1 一番単純な答えは、JISの出来が悪かったから、というものだと思う。
336 :デフォルトの名無しさん :2011/12/14(水) 22:02:31.30 .net 日本語の文字コードがいくつもある理由 http://qpon.at.webry.info/201112/article_14.html
337 :デフォルトの名無しさん :2012/01/04(水) 00:38:14.32 .net IVSというかUnicodeに見る日本政府のダメな感じ ttp://wontfix.blogspot.com/2011/05/ivsunicode.html
338 :デフォルトの名無しさん :2012/01/04(水) 05:48:12.54 .net この人の文字コードに対する理解力がダメな感じ
339 :デフォルトの名無しさん :2012/01/04(水) 11:38:46.62 .net IVSは同一字形でも包摂しない、という原則じゃなかったっけ?というか同一字形かどうか わからないから、だったかも。そもそもIVSで区別されているのはグリフであって文字ではないわけで。
340 :デフォルトの名無しさん :2012/07/25(水) 17:25:52.49 .net
341 :デフォルトの名無しさん :2012/08/22(水) 23:46:05.05 .net >>322 ・文字集合はIBMホストコードに合わせてあって ・符号の順序はJIS順になっていて ・1978年版、1983年版、1990年版をそつなくこなし ・JISの水準外の文字はJISの区点内にも区点外のどちらにもある とどめに ・半角カタカナと一緒に使える ってことだな
342 :デフォルトの名無しさん :2012/10/07(日) 12:14:01.29 .net
343 :デフォルトの名無しさん :2012/11/29(木) 11:16:09.54 .net 空揚げ
344 :デフォルトの名無しさん :2012/11/30(金) 12:55:47.17 .net そんなこんなで本スレが落ちてしまったわけだが
345 :デフォルトの名無しさん :2012/11/30(金) 13:22:07.85 .net 文字コード総合スレ part8 http://toro.2ch.net/test/read.cgi/tech/1354248962/ 文化の数だけ文字がある
346 :デフォルトの名無しさん :2012/12/01(土) 00:25:34.28 .net >>345 乙
347 : 忍法帖【Lv=3,xxxP】(1+0:5) :2013/11/28(木) 00:46:29.39 .net あげ
348 :デフォルトの名無しさん :2014/08/29(金) 21:47:32.66 ID:q83myYC6.net http://www.buzzword.jp/img/face10.png
349 :デフォルトの名無しさん :2014/11/19(水) 16:18:55.03 ID:JZ2oYyd9.net ㄘんㄘんㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ
350 :デフォルトの名無しさん :2014/11/19(水) 18:54:03.45 ID:g6yRyndh.net だいたい1バイトのアスキーコードを、2バイトにして日本語を 表示できるようにしたり、それをさらに、3バイトとか4バイトに 増やすとか、チマチマそんなことしてきたから、いろんな文字コード 作られてワケワカメになったんだろ。 もうこの際、全ての言語や記号など全部表せるように、 文字コードは1文字16バイトくらいにして、 全ての文書にこのコードを使う事を強制すればいい。 16バイトもあれば、困ることは無いだろう。
351 :デフォルトの名無しさん :2014/11/19(水) 19:53:15.84 ID:0+0ozXC3.net ㄘωㄘωㄟ⁰ㄋㄟ⁰ㄋㄜㄝㄋ
352 :デフォルトの名無しさん :2014/11/20(木) 00:22:16.17 ID:8wQd6afC.net >>350 これ、釣りなのかな。
353 :デフォルトの名無しさん :2014/11/20(木) 10:27:23.90 ID:EmAWw9wC.net (。☉౪ ⊙。) (。◕ฺˇε ˇ◕ฺ。) (。◕ิ_◕ิ。) (。◕ˇдˇ◕。) (。◕ˇ_ˇ◕。) (。╹ω╹。) (。╹ω╹。) (。≖ิ‿≖ิ); (。•́︿•̀。) (。ó .̫ ò。) (。´ސު`。) 色々あるんやね
354 :デフォルトの名無しさん :2014/12/05(金) 00:46:33.27 ID:ddy5/aJe.net >>350 データ容量が無駄
355 :デフォルトの名無しさん :2014/12/05(金) 10:32:24.04 ID:NyP973bT.net 将来ジャミング暗号化に使われそうなアルゴリズムだな
356 :デフォルトの名無しさん :2015/06/12(金) 10:29:07.43 ID:oHwTsYwMJ あ
357 :デフォルトの名無しさん :2015/06/12(金) 10:29:46.56 ID:oHwTsYwMJ すばらし
358 :デフォルトの名無しさん :2016/03/29(火) 09:28:41.71 ID:/c8bAcK4.net サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ https://www.youtube.com/watch?v=NDq1QoJY0nY 宇ドナルドアナリストパワーストーンコーチングとしまえん サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足 サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題 春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残 コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題 マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了 校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント 高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート
359 :デフォルトの名無しさん :2016/08/29(月) 19:33:30.09 ID:sf9PpAXO.net 1978年 JIS C 6226が成立。 1981年 当用漢字表が廃止されて常用漢字表が告示される。 それまでの1850字に95字が追加され1945字になる。 その95字が全てJIS第一水準。一体何があったのか。
360 :358 :2016/08/29(月) 19:39:42.82 ID:sf9PpAXO.net ここで勝手に憶測。 1. 78JISが成立した時点で、文部省が通産省に圧力をかけて、将来の常用漢字に 入れたくない字を無理やり第2水準に追いやった。 2. 常用漢字表を作る際に、第2水準の字を加える事を第2水準であるという理由で拒否。 何としてでもなるべく字を増やしたくないという口実にJISが利用された。
361 :358 :2016/08/29(月) 21:29:18.35 ID:sf9PpAXO.net 2010年11月30日 常用漢字表改定 196字追加、5字削除、2136字となる。 1881年とは時代が違う社会が違う、という事か、JIS第2水準の字も多く追加された。 第3、第4水準の字すら入っている。 もしJISの83改定がなければ殆ど第2水準で済んでいた。
362 :358 :2016/09/02(金) 16:08:22.98 ID:YK1p9+vc.net 文部科学省の常用漢字表にはJISコードが記載されていない。まさに縦割り行政だ。 常用漢字の通し番号も無い。 一般的にはこれで困る人はいない。だがそれでいいのか。 法律の如き、あるいは数学の如き厳密さを求めると、常用漢字表の字とJIS規格票の字が 同じ字であるとは見なせない。 民間の漢和辞典にはJISコードの記載があるが、その厳密な根拠はどこにも無いという事になる。 国が率先して論理的思考を実践してほしい。
363 :デフォルトの名無しさん :2016/12/07(水) 00:05:59.62 ID:34HNZ6/r.net 意味もなく Age。 JIS漢字にしても、まるぶん漢字にしても、日常生活に結構影響が出ている。 同級生のパパ、議員やっていたんだが、該当する漢字がなくて、全部当て字で済ましている。 姓の歴史を見ればわかる通り、明治の初めに姓が法制化された。 漢字が書けないことが多くて、近所(?、1泊で往復できるぐらいの距離)のエライ坊さんのところに行って漢字を教えてもらった。 これが、同音の文字を崩して、別の意味を持たせた。 地名も同様なものがある。 社名も、鉄を使わない(金を失う)ではなく、旧字を使うとロコがある。 Toron コードでは大体そろっていたはずなんだけど、見ていないからわからない。
364 :デフォルトの名無しさん :2016/12/08(木) 21:34:23.40 ID:5SK5WFdP.net Toronコード
365 :デフォルトの名無しさん :2016/12/11(日) 14:59:51.79 ID:pm6ghExK.net >>1 マイナーな文字コードは徹底的に無視して、淘汰すればいい 「サポートしなければならない」という糞みたいな固定観念を 捨てることが大事。
366 :デフォルトの名無しさん :2016/12/24(土) 00:11:12.03 ID:tCnPOkaj.net 漢字コードは浮動小数点数コードにしとけばよかったんだよな
367 :デフォルトの名無しさん :2016/12/24(土) 06:02:44.63 ID:NChqVw6n.net 現実世界の方言は好き
368 :デフォルトの名無しさん :2016/12/26(月) 20:12:45.34 ID:TRnwbnfO.net まともなこと言ってる方が駆逐される不思議な国ニッポン http://nukalumix.hateblo.jp/entry/nenkin_iroha https://www.taro.org/2016/12/%E3%81%84%E3%82%8D%E3%81%84%E3%82%8D%E3%82%A4%E3%83%AD%E3%83%8F%E3%81%AA%E7%9A%86%E6%A7%98%E3%81%B8.php http://nlab.itmedia.co.jp/nl/articles/1612/12/news127.html
369 :デフォルトの名無しさん :2017/02/09(木) 16:30:11.04 ID:8bYRq8V4.net 最初5bitから始まった話とかロッキングシフトの話とかからの話から始まると思ったら、ここまで出てこないのは何なの?
370 :デフォルトの名無しさん :2017/08/29(火) 22:15:11.99 ID:MJTdI4fF.net ローマ字で日本語の長音を表現するのにサーカムフレックスまたはマクロンの付いた アルファベットが有ると便利。というか必要。 しかしこれが長い間JISに採用されなかった。 ローマ字主義者と反対派の血みどろの戦いが繰り広げられ、ローマ字主義者が 負け続けたのだろうか。
371 :デフォルトの名無しさん :2018/01/08(月) 11:02:55.15 ID:szpKYJOz.net ユニコードですら絵文字で大混乱してるからな
372 :デフォルトの名無しさん :2018/01/08(月) 12:10:38.61 ID:g3wGVkXu.net 明らかに文字化けって判るような壊れ方ならまだいいけど 送信側が↑↑↑で送信してるのに 受信側で↓↓↓って表示されてたり って普通にあるからなー
373 :デフォルトの名無しさん :2018/01/08(月) 12:45:25.22 ID:hdddIjmR.net 絵文字の正規表現に対応しているのは、Ruby 2.4 以降だけかも
374 :デフォルトの名無しさん :2018/01/09(火) 03:13:02.13 ID:69Y93T5M.net うんこ騒動はなぜ起きた?
375 :デフォルトの名無しさん :2018/01/20(土) 12:34:45.37 ID:4AOaXNlF.net 本スレ落ちそう http://www.gakkai.ne.jp/jss/bulletin/guide1.php
376 :デフォルトの名無しさん :2018/01/22(月) 23:21:50.19 ID:UK/uqEp5.net 文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/ 立てた。
377 :デフォルトの名無しさん :2018/01/24(水) 05:29:19.56 ID:PJ1wHVKm.net >>376 おつん
378 :デフォルトの名無しさん :2018/01/28(日) 15:12:12.86 ID:Erw8GBm0.net >>369 おお、同志よ。 たぶん、文字コードに詳しく無い人が多いからだろうね。 ここにいる人達はあまり詳しい人がいないみたい。 俺も詳しく無いけど。 混迷期の読み物を興味深く読むのは面白い。
379 :デフォルトの名無しさん :2018/05/23(水) 20:36:26.50 ID:Au5e7VGg.net 僕の知り合いの知り合いができたパソコン一台でお金持ちになれるやり方 役に立つかもしれません グーグルで検索するといいかも『ネットで稼ぐ方法 モニアレフヌノ』 Z1BZ2
380 :デフォルトの名無しさん :2018/07/05(木) 01:16:25.52 ID:RfoszcD2.net 9Z7
381 :デフォルトの名無しさん :2018/11/23(金) 10:17:55.52 ID:e4GZHgy/.net コードおしえて https://twitter.com/Takuta/status/1064769978040107008 (deleted an unsolicited ad)
382 :デフォルトの名無しさん :2019/03/08(金) 15:02:24.13 ID:uMMKH+w1.net っ https://gist.github.com/tenpoku1000/d60efa587b185ab34e36c70622934892
383 :デフォルトの名無しさん :2019/03/08(金) 15:12:45.64 ID:Im37M35h.net ハローワールド
384 :デフォルトの名無しさん :2019/04/06(土) 20:46:36.38 ID:v8Dss5L/.net ディスクやメモリの容量に関してけちけちしなければならない時代ではもはやないから、 UTF32にさっさと統一してしまった方が良い。
385 :【猫の日】なぜ多い? 春の「猫の交通事故」 :2021/02/22(月) 13:23:14.54 ID:560/33vK.net https://asahi.5ch.net/test/read.cgi/newsplus/1613963569/l50 年間30万匹超 猫の交通事故を減らすために出来ることは 2月22日は、猫の日制定委員会が「ニャン・ニャン・ニャン」の語呂合わせから制定した「猫の日」です。猫は屋外で放し飼いされていることもあるほか、野良猫として暮らしている猫もよく見かけます。そのため、猫は比較的交通事故に巻き込まれやすい動物でもあるのです。
386 :デフォルトの名無しさん :2021/12/13(月) 15:55:12.76 ID:zEMsblTa.net サター
387 :デフォルトの名無しさん :2023/09/25(月) 20:04:52.06 ID:+J4Cdjdz.net ホンマにそれがええんか?
388 :デフォルトの名無しさん :2024/04/08(月) 00:07:31.00 ID:gUGErxP/.net キャラクタセットの種類なのか? 文字のコードの数なのか?
389 :デフォルトの名無しさん :2024/04/08(月) 00:08:00.14 ID:gUGErxP/.net いまどきキャラクタセットのことを文字コードと呼ぶのは混乱を招くだけ
390 :デフォルトの名無しさん :2024/04/08(月) 09:16:19.01 ID:9TXPQqPK.net 文字コード廃止しなさーーい。 でもモピロン、Emojiなら🙆 ∵文字コード❌ やっぱり、文字は、手書きは、いいよな。 https://o.5ch.net/22xbl.png
391 :デフォルトの名無しさん :2024/04/12(金) 10:52:04.90 ID:T6Cc2W5H.net >>1 主にNECが戦犯
392 :デフォルトの名無しさん :2024/04/12(金) 10:55:17.68 ID:Aub4//wW.net ヨーロッパ圏でも字の上に点やら何やら付いてる文字はあるからなぁ アメリカやイギリスが規格を考えるから問題が出たんだよ
393 :デフォルトの名無しさん :2024/04/16(火) 00:37:14.97 ID:aRJ0OCMo.net で、何だな、windowsのメモ帳で 「\」をタイプするとモチロン「\」と表示されるけど 書式-フォントを Courier Newにすると 「\」は「\」の半角で表示されるな。 バイナリベースでコードは変わってないのに フォントを変えると全く別のに変化する ぽぃぞ だから、文字コードなんて廃止して 全部絵文字とかGIFとかPNGでデザインすりゃいいのに 完全に地球人は樹海にハマったね。┐(´д`)┌ヤレヤレ
88 KB
新着レスの表示
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★
本文 スレッドタイトル 投稿者