2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

文字コード総合スレ part9

1 :デフォルトの名無しさん:2014/05/29(木) 03:29:39.61 ID:i1u97cMX.net
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/

947 :デフォルトの名無しさん:2015/09/30(水) 01:54:42.47 ID:WLNnb+Qg.net
わからないです

948 :デフォルトの名無しさん:2015/09/30(水) 07:55:03.57 ID:BGePcDbg.net
わからないならレスしないでください
うざいだけです

949 :デフォルトの名無しさん:2015/09/30(水) 10:33:22.20 ID:EwFP0hNI.net
そこら辺のファイルを選択してメニューからコピー、テキストエディタの編集画面へペーストすると
ファイルのパスがURI形式だったりそうでなかったり
普通にファイル操作してる分には渡っている内容なんてどうでも良いけど

950 :デフォルトの名無しさん:2015/09/30(水) 19:09:51.27 ID:AXFtzTRL.net
ffだな

951 :デフォルトの名無しさん:2015/09/30(水) 20:05:15.30 ID:s2AXvsDq.net
>>943
参加してはいけないほどの知識のなさを露呈してるのがお前

952 :デフォルトの名無しさん:2015/09/30(水) 21:17:15.90 ID:RUmQvCwV.net
>>951
まず何を指摘したいのか論点を明確にすべき

953 :デフォルトの名無しさん:2015/10/01(木) 04:04:28.30 ID:KD3TII7s.net
流れが読めない

954 :デフォルトの名無しさん:2015/10/01(木) 08:31:19.73 ID:yiH/SWpL.net
>>952
それは大元の方に対してすべきレスだろw

955 :デフォルトの名無しさん:2015/10/06(火) 15:23:20.14 ID:ZA2UYVtv.net
ケンカはやめて><

956 :デフォルトの名無しさん:2015/10/09(金) 11:43:27.05 ID:6XKz53I/.net
二人をとめて><

957 :デフォルトの名無しさん:2015/10/10(土) 05:40:40.12 ID:vQ6uFwh8.net
なんで文字コードっていくつも種類があるの?
一つにまとめてください

958 :デフォルトの名無しさん:2015/10/10(土) 09:50:35.92 ID:AEij/GW+.net
冗談抜きでそろそろ次世代文字コードの議論が始まってもいいころ

959 :デフォルトの名無しさん:2015/10/10(土) 12:29:41.93 ID:/egW/Cb1.net
これ以上増やすな

960 :デフォルトの名無しさん:2015/10/10(土) 19:57:22.89 ID:FFYf3E/t.net
unicodeに仕様かぶせた物を作っていくだけでしばらくはいいと思うけどね
・自動伸張するバイトコード
・コードポイントをベースに単位ビットを変えた表現系がいくつか存在
は優れた仕様だと思うし

まぁ実装する側にしたら可能な限り単純な仕様で表現できる文字コードが有った方がいいんだけど

961 :デフォルトの名無しさん:2015/10/10(土) 20:15:08.58 ID:wZWPBuKi.net
でもさ、IPアドレスは32bitでつい最近まで問題なかったじゃないですか
当時としてはかなり豪華な仕様で先見性があったと思うんですが
これと比べて文字コードは上手くなかったですね

962 :デフォルトの名無しさん:2015/10/10(土) 20:33:51.67 ID:V2VcFn7b.net
文字コードを実用化したのは恐らくテレタイプだろうと思うけれど、
テレタイプはアルファベット大文字しか使わないから、5単位の紙テープ
で十分だった。即ち5ビットで良かったけれどその後コンピュータが出てきて
アルファベットの小文字とか記号とか扱いたいということで、8ビットになった
といういきさつがあり、8ビットでは日本語や中国語みたいな文字が沢山ある
文字体系では8ビットは足りないということから、2バイトの文字体系ができて
きたのだろうと思う。
最初にテレタイプの文字体系を作った人は、テレタイプで漢字を打とう等と
思わなかったので、5ビットで十分だとおもったのでしょう。

963 :デフォルトの名無しさん:2015/10/10(土) 20:49:44.52 ID:wZWPBuKi.net
それは当時のインターネットも同じだよね
まさかここまでの台数になるとはね

964 :デフォルトの名無しさん:2015/10/10(土) 23:55:57.41 ID:dj1rxVzV.net
sjisの存在意義が分かりまん。
utf8にしとけよ

965 :デフォルトの名無しさん:2015/10/11(日) 04:01:04.46 ID:6Iv1v6AG.net
JISコードよりいいだろ?

966 :デフォルトの名無しさん:2015/10/11(日) 04:18:53.37 ID:xYzp6qB4.net
>>964
歴史的理由以外に何をお望みかね?

967 :デフォルトの名無しさん:2015/10/11(日) 04:21:02.44 ID:lvBy10+w.net
sjisなら漢字も2バイトで済むとか

968 :デフォルトの名無しさん:2015/10/11(日) 06:13:33.76 ID:szr3Lmao.net
日本NBによるARIB記号と変体仮名の提案がUTC Document Registerに回ってきてる

969 :デフォルトの名無しさん:2015/10/11(日) 10:56:26.85 ID:ngi+Bnfd.net
>>963
IPv4+NATはコードページに似てるかな

970 :デフォルトの名無しさん:2015/10/11(日) 16:52:05.67 ID:ZXEtXcbw.net
SJISは半角カナをそのまま使えたという点で、半角カナ全盛の時期にはちょうどよかった

971 :デフォルトの名無しさん:2015/10/11(日) 17:19:08.52 ID:ngi+Bnfd.net
半角カナ禁止って誰が言い出したし

972 :デフォルトの名無しさん:2015/10/11(日) 17:27:41.52 ID:ZXEtXcbw.net
どうだったっけ、インターネットが出てきて、メールが8bit通らないことが多かったのと
当時からサーバに採用されたUNIX機のEUCが半角カナの処理適当だったから
とかじゃなかったか

973 :デフォルトの名無しさん:2015/10/11(日) 17:30:49.26 ID:ZXEtXcbw.net
メールで使われたISO2022-JPもカナ含んでなかったよね

974 :デフォルトの名無しさん:2015/10/11(日) 17:45:23.41 ID:AQhK5jCj.net
半角カナはそもそも醜い
せめてフォントで濁点半濁点の半角カナを合字処理してくれればいいのに

975 :デフォルトの名無しさん:2015/10/11(日) 17:47:14.32 ID:VUX4VOf2.net
文字コードがこんな事になったのは、CJKに政治パワーが無かったのか
あるいはCJKが場当たり的で、いい加減な民族だったからなのか

976 :デフォルトの名無しさん:2015/10/11(日) 17:49:42.27 ID:VUX4VOf2.net
日本でも半角カナや円マーク問題があって
特に円マークに関しては未だにキモいことになっている
一番使われているOSのWindowsのパスの区切りが
バックスラッシュじゃなくて円マークになってしまった!!

977 :デフォルトの名無しさん:2015/10/11(日) 17:53:15.54 ID:VUX4VOf2.net
バックスラッシュを円マークで置き換えるアイデアは、
創意工夫と評価して良いんですかね、どう思います?

978 :デフォルトの名無しさん:2015/10/11(日) 18:10:58.26 ID:RR38ws7N.net
円マークはISO646に従ったらそうなっただけ
後にUnicodeが出てきて破綻した

979 :デフォルトの名無しさん:2015/10/11(日) 18:17:43.03 ID:q6MPKEN+.net
区切り文字記号が「¥」って、視覚イメージとして駄目駄目だろ

980 :デフォルトの名無しさん:2015/10/11(日) 18:27:15.57 ID:oej2eVPd.net
シフトJISは創意工夫かもしれないけど
円マーク置き換えは>>978の歴史的経緯と
0x00-0x7Fは他の文字に変換したくないって妥協の産物でしょう

981 :デフォルトの名無しさん:2015/10/11(日) 18:27:51.86 ID:/oRhSUnv.net
連レスする人は自己主張が強いって死んだじっちゃんが言ってた

982 :デフォルトの名無しさん:2015/10/11(日) 18:35:03.02 ID:PJiNPBNj.net
円マークはU+A5にちゃんとあるんだから、U+5Cはバックスラッシュになってるフォントを使え

983 :デフォルトの名無しさん:2015/10/11(日) 20:58:11.54 ID:VUX4VOf2.net
何でみんな、バックスラッシュを置き換えてでも円マークが必要だったって立場なんだ?
今となっては円マーク無しのままのほうが良かったんじゃないの?
「yen」とか「Y」とかで代用すればよかっただけじゃね?

984 :デフォルトの名無しさん:2015/10/11(日) 21:01:42.85 ID:VUX4VOf2.net
無くても良かったんじゃねってのは当時の話な
バックスラッシュを置き換えてまで導入する意味は無かったんじゃないかって言う
円マークは漢字と同じ扱いで良かったのでは

985 :デフォルトの名無しさん:2015/10/11(日) 21:23:31.73 ID:g193ri6N.net
むしろ当時バックスラッシュみたいな日常使わない文字を入れる方が不自然

986 :デフォルトの名無しさん:2015/10/11(日) 22:14:00.31 ID:PJiNPBNj.net
カタカナどころかASCIIコードが安定する前の時代から、金の計算は需要があったってことだろ

987 :デフォルトの名無しさん:2015/10/11(日) 22:31:58.07 ID:VUX4VOf2.net
でもそのおかげで未だにWindowsのパスの区切り文字が円マークになってしまったわけですが
「Yen」とか「Y」でも十分円マークの代わりになったのでは?

988 :デフォルトの名無しさん:2015/10/11(日) 22:41:52.13 ID:PJiNPBNj.net
むしろバックスラッシュだけで済んだのが奇跡的なんじゃないか
昔のPC-60とか関数電卓とか、チルダや中括弧も揃ってるか怪しいのにトランプマークとかあったりするぞ

989 :デフォルトの名無しさん:2015/10/11(日) 22:48:43.70 ID:38jXbsP1.net
$記号があるんだから円記号も定義してくなるのも不思議ない日本人だもの

990 :デフォルトの名無しさん:2015/10/11(日) 23:27:22.68 ID:oej2eVPd.net
当時置き換えたのは仕方ないんじゃないかねぇ
ASCIIから文字入れ替えたのは日本だけじゃなくてイギリスフランスドイツイタリアみんなやってたことだし
ただヨーロッパ勢はその後ASCIIそのまま+拡張のISO/IEC 8859シリーズに向かったから
日本だけISO/IEC 646バリエーションを使い続けて乗り遅れた感はあるかも(後知恵だけどね)

あとWindowsのパスの区切り文字は原則論で言うなら
各国で変えていい文字の\を選んだマイクロソフトが悪いような

991 :デフォルトの名無しさん:2015/10/11(日) 23:36:13.81 ID:AQhK5jCj.net
円マークじゃなくてそのまま「円」使っとけばよかったんや

992 :デフォルトの名無しさん:2015/10/12(月) 09:09:29.06 ID:zbl5WMm7.net
ドルも弗にしよう

993 :デフォルトの名無しさん:2015/10/12(月) 14:16:40.04 ID:QD0vOYoj.net
$(0x24)を\にすれば良かったんよ

994 :デフォルトの名無しさん:2015/10/12(月) 14:31:59.08 ID:w11UjhQH.net
それ経済が大混乱するやろ

995 :デフォルトの名無しさん:2015/10/12(月) 14:52:26.42 ID:QD0vOYoj.net
そこでl10nですよ

996 :デフォルトの名無しさん:2015/10/12(月) 15:01:29.56 ID:mWUWwMlc.net
大昔、IBMのオンライン端末でカナ表示モードにすると $ が \ になったなw
EBCDICでもコード被ってなかったと思うけど、なんでああなったんだろ

総レス数 996
229 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★