■ このスレッドは過去ログ倉庫に格納されています
文字コード総合スレ Part10
- 1 :デフォルトの名無しさん:2015/10/14(水) 20:29:00.08 ID:xctG4AAd.net
- プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。
■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
- 2 :デフォルトの名無しさん:2015/10/14(水) 20:30:38.15 ID:xctG4AAd.net
- ■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/
- 3 :デフォルトの名無しさん:2015/10/14(水) 20:31:02.98 ID:xctG4AAd.net
- ■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
- 4 :デフォルトの名無しさん:2015/10/14(水) 20:31:39.28 ID:xctG4AAd.net
- ・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「?心」簡化政策によると「?(U+6076)」に統一。口偏+?(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか
- 5 :デフォルトの名無しさん:2015/10/14(水) 20:31:59.03 ID:xctG4AAd.net
- ・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
→ ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
コントロールパネル-地域と言語のオプション-[言語]タブで
「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。
- 6 :デフォルトの名無しさん:2015/10/14(水) 23:23:47.69 ID:obUlIRbX.net
-
- 7 :デフォルトの名無しさん:2015/10/14(水) 23:28:48.06 ID:+mXu/6rb.net
- もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/
隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/
- 8 :デフォルトの名無しさん:2015/10/14(水) 23:29:44.73 ID:+mXu/6rb.net
- ■ライブラリ
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/
- 9 :デフォルトの名無しさん:2015/10/14(水) 23:30:41.28 ID:+mXu/6rb.net
- ■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
'0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
- 10 :デフォルトの名無しさん:2015/10/14(水) 23:31:54.53 ID:+mXu/6rb.net
- JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/
ISO/IEC JTC1/SC2/WG2/IRG
Ideographic Rapporteur Group
http://appsrv.cse.cuhk.edu.hk/~irg/
- 11 :デフォルトの名無しさん:2015/10/15(木) 18:31:09.40 ID:xOsbEBDE.net
- >>4が化けてるな前スレもだが
- 12 :デフォルトの名無しさん:2015/10/15(木) 18:40:33.47 ID:jm/ZzoYR.net
- 4とか5とかもう引き継がなくていいのでは
- 13 :デフォルトの名無しさん:2015/10/16(金) 16:24:02.87 ID:rHUq12EW.net
- &#x6076;
- 14 :デフォルトの名無しさん:2015/10/16(金) 16:24:47.61 ID:rHUq12EW.net
- 恶
- 15 :デフォルトの名無しさん:2015/10/17(土) 20:16:21.68 ID:E+N5KQ+e.net
- 文化庁の文化審議会漢字小委員会は16日、漢字の手書き文字について、「とめる」か「はらう」かなど、細部にこだわって正誤を判断せず、多様な字形を認めるべきだとする指針の中間報告案をまとめた。
- 16 :デフォルトの名無しさん:2015/10/18(日) 22:08:48.48 ID:/JqZyvWj.net
- 明日から松江でWG2らしいけど文書非公開だと流れが追えなくてつまらんな
- 17 :デフォルトの名無しさん:2015/10/19(月) 00:12:31.07 ID:Vwmjvaq0.net
- うむつまらん
- 18 :デフォルトの名無しさん:2015/10/22(木) 19:44:06.99 ID:HJqUYTXB.net
- Unicodeおじさんがミラーしてくれた
http://www.unicode.org/wg2/docs/
Nushuが1b170からになってるってことはKana Supplementがそこまで広がったのかな
- 19 :デフォルトの名無しさん:2015/10/24(土) 00:34:11.18 ID:5L65oHkd.net
- >>15
これか。
http://srad.jp/story/15/10/20/0510245/
ただでさえ漢字が多すぎて困っている。それをさらに増やすような法務省の莫迦に対する歯止めとして期待。
- 20 :デフォルトの名無しさん:2015/10/25(日) 03:36:16.82 ID:fgAWLXG9.net
- >>12
同意
古いのが多すぎるし
- 21 :デフォルトの名無しさん:2015/10/25(日) 12:49:19.83 ID:ekYyyren.net
- >>12
引き継がないとはどういう意味ですか?
- 22 :デフォルトの名無しさん:2015/10/25(日) 18:50:42.59 ID:zgU7ZYeY.net
- 3-5と9はもうテンプレから外していいんじゃないかなって話かと
20も言うように古いし更新されてないしどういう文脈の話かわからないのもあるし
レス番指定してるレスが混じってるけどPart何スレかもわからないしよく見ると色々あれ
- 23 :デフォルトの名無しさん:2015/10/25(日) 19:24:02.31 ID:A/UjGnAW.net
- >>3-5はいらないけど、しれっと>>9を紛れ込ませるのは許さん
- 24 :デフォルトの名無しさん:2015/10/25(日) 19:33:16.94 ID:8Ekj0BDy.net
- >>9は議論の軌跡としては正しいのかも知れないけど内容が間違いだらけなので消した方が吉
- 25 :デフォルトの名無しさん:2015/10/26(月) 20:48:28.23 ID:hvOVpGBH.net
- 絵文字馬鹿のOむかつく
とっとと干されりゃいいのに
- 26 :デフォルトの名無しさん:2015/10/27(火) 07:41:18.41 ID:ecThD4uO.net
- ほんとにな
他に実績ない絵を字として登録してない?
そのうちLINEスタンプとか報道写真も登録するんじゃねえの。
一方で互換性ガー言って過去のミス登録を修正しないし。
WAVE DASH例示字形ですら25年かかるという無能揃いの組織。
過去版との互換性なんかとうの昔になくなってるのに。
- 27 :デフォルトの名無しさん:2015/10/27(火) 23:40:44.85 ID:b1wh6dDM.net
- Unicodeコンソーシアムがアレなのは否定しないってか同意だが
WAVE DASHの問題はMSが独自の変換表を使ってるからなので
正直例示字形だけ直されてもあまり意味がってか字形だけならWindows Vista以降修正されてるし
いやそりゃ正しい波の形になったから気分はすっきりするけど。
- 28 :デフォルトの名無しさん:2015/10/28(水) 02:14:09.30 ID:6/ByidLc.net
- ってか全角チルダのほうの字形(?)を上に寄せてくれんかな。
- 29 :デフォルトの名無しさん:2015/10/28(水) 07:10:47.43 ID:en6I5N16.net
- >WAVE DASHの問題はMSが独自の変換表を使ってるから
どうしてこういう見え透いた嘘を平気でつけるんだろうか
- 30 :デフォルトの名無しさん:2015/10/29(木) 20:27:41.85 ID:Lz+b+/gX.net
- >>29
無知?それとも俺には問題ないという青年の主張?
- 31 :デフォルトの名無しさん:2015/11/02(月) 21:17:58.86 ID:AsQYV5Wm.net
- >>29
勉強し直そうね
- 32 :デフォルトの名無しさん:2015/11/02(月) 21:18:31.16 ID:AsQYV5Wm.net
- >>28
ほんまそれ
- 33 :デフォルトの名無しさん:2015/11/03(火) 04:49:27.68 ID:i5nTnJv9.net
- 逆Sの記号ってなんでないんだろう?
- 34 :デフォルトの名無しさん:2015/11/03(火) 05:49:15.31 ID:zO1n76ez.net
- M?
- 35 :デフォルトの名無しさん:2015/11/03(火) 07:38:16.60 ID:sxF23lrF.net
- Ƨ
- 36 :デフォルトの名無しさん:2015/11/03(火) 17:26:02.76 ID:P1Dl09Tr.net
- クローゼットの中にそういうハンガーみたいな金具たくさん入ってるけど
どういうときに使えるのか未だにわからない。
- 37 :デフォルトの名無しさん:2015/11/04(水) 00:41:30.22 ID:L8/5F95r.net
- 肩の厚みのあるハンガーをたくさんかけると、
スペースが無駄になるので互い違いに高さを変える。
- 38 :デフォルトの名無しさん:2015/11/04(水) 01:28:04.95 ID:uMca4o1w.net
- 向きが90度ずれない?
S字のを2個連結すれば戻るけど2個使い前提の道具なの?
- 39 :デフォルトの名無しさん:2015/11/04(水) 16:58:03.51 ID:QtO4ndAT.net
- あれはスペースの有効活用が優先で
向きがずれる(逆になる)のは承知で使うんじゃないか?
>>31
しかし、チルダの全角形を本来の意味(?)で必要としているユーザーはどれだけいるんだろうかと思う
- 40 :デフォルトの名無しさん:2015/11/05(木) 23:49:21.72 ID:clXjiXU8.net
- スレ違いかもしれんが
ネットで、ある日本語のテキストファイルを見たら化け化けだった
3分の1くらいのみ見れる
これをブラウザで簡体字中国語を選ぶと見れるという書き込みを見つけたので、
そうしたら見れた
これはどういうこと?
中国語扱う人が日本語をGB2312でエンコードしてたってこと?
- 41 :デフォルトの名無しさん:2015/11/05(木) 23:59:17.68 ID:gSAo/oaU.net
- ふつうに考えるとそうだろうな
- 42 :デフォルトの名無しさん:2015/11/06(金) 06:30:43.46 ID:6Ax8SlYK.net
- >>39
使用頻度は気にしなくていいんだよ
全チルがあればそれでいい
あとはマッピング直してくれれば。
- 43 :デフォルトの名無しさん:2015/11/07(土) 23:09:16.59 ID:NHx999Nj.net
- http://wired.jp/2015/11/07/finland-national-emoji/
- 44 :デフォルトの名無しさん:2015/11/08(日) 14:35:15.95 ID:y8uRNach.net
- お国自慢絵文字か。文字コードに押し込もうというわけでなければ、
ありふれたご当地ゆるキャラを何匹か並べたら大体同じ趣旨の日本版になるな。
- 45 :デフォルトの名無しさん:2015/11/08(日) 17:13:00.26 ID:BjW4Fik6.net
- 絵文字は文字以上に定義も難しいしキリがないからユーザー外字領域に閉じ込めておけばよかったのに。
- 46 :デフォルトの名無しさん:2015/11/09(月) 00:23:08.17 ID:loOQ2SCd.net
- 作った奴と押し込む奴は往々にして別、
- 47 :デフォルトの名無しさん:2015/11/09(月) 01:28:50.80 ID:9QpSgphP.net
- >>46
?
- 48 :デフォルトの名無しさん:2015/11/09(月) 07:42:22.13 ID:L+fm0eEi.net
- さすがに、外字領域での大規模な運用ぐらいはされてないと押し込みの提案も出ないんじゃなかろうか
- 49 :デフォルトの名無しさん:2015/11/09(月) 09:49:40.58 ID:Yjqxj+LL.net
- nokiaの端末に入っちゃったんでしょう?
- 50 :デフォルトの名無しさん:2015/11/09(月) 14:08:54.96 ID:wh2HsxEX.net
- Unicode 10.0あたりになったら収録されるんだろうか?
- 51 :デフォルトの名無しさん:2015/11/09(月) 22:16:17.29 ID:yLbPQAdL.net
- >>49
そうなの?文字として?
- 52 :デフォルトの名無しさん:2015/11/09(月) 23:44:45.41 ID:BJx9eA+t.net
- ビットコインマーク、Unicodeに収録へ | スラド IT
http://it.srad.jp/story/15/11/09/055230/
Bitcoin 'B' Approved By Computer Text Standards Body
http://www.coindesk.com/bitcoin-unicode-symbol-approval/
http://www.unicode.org/L2/L2015/15229-bitcoin-sign.pdf
- 53 :デフォルトの名無しさん:2015/11/10(火) 12:10:29.99 ID:tU9IcOly.net
- ペリカもはよ
- 54 :デフォルトの名無しさん:2015/11/11(水) 22:12:58.76 ID:mDE1AFdu.net
- ぼ
さ
ん
- 55 :& ◆Pw.ZL0FkaP42 :2015/11/11(水) 22:13:45.21 ID:mDE1AFdu.net
- s
- 56 :デフォルトの名無しさん:2015/11/11(水) 22:23:37.04 ID:rMaJFptQ.net
- GB2312に平仮名、片仮名が収録されているというのも不可解なもんだ。
あいつら反日、嫌日のはずなのに。
- 57 :デフォルトの名無しさん:2015/11/11(水) 23:13:58.34 ID:oIjjO58x.net
- シュエエアィサィ的な使い方を想定していたんじゃなかろうか
- 58 :デフォルトの名無しさん:2015/11/12(木) 23:09:21.24 ID:fGMv4NR4.net
- しかも簡体字フォントの仮名のデザインが脱力。
日本語版Windowsにも標準で付いている。たぶんMacにも。
- 59 :デフォルトの名無しさん:2015/11/13(金) 14:48:06.39 ID:tDbTQZeN.net
- 韓国のKS C 5601(KS X 1001)にも平仮名、片仮名入ってるし
単にJIS C 6226(JIS X 0208)の構造コピーして必要なところ以外はそのまま放置しただけなんじゃ……。
- 60 :デフォルトの名無しさん:2015/11/13(金) 16:17:05.05 ID:UEuwKYUJ.net
- 日本語の文章捏造するために必要だから
- 61 :デフォルトの名無しさん:2015/11/13(金) 17:57:15.36 ID:P1S0o/po.net
- GBKはX 0208をベースに作った
韓国はX 0208をパクった上に起源を主張し出した
- 62 :デフォルトの名無しさん:2015/11/14(土) 12:15:58.19 ID:cxUMG3m7.net
- そういうのは嫌韓嫌中スレでやってねw
- 63 :デフォルトの名無しさん:2015/11/14(土) 16:21:16.08 ID:JBEqdozk.net
- Androidでのダウンロードしたアプリのapkファイルを取り出してESファイルエクスプローラというアプリでapkファイルの拡張子をzipにして中身を見てるんだけど文字化けしてみえない
どの文字コードにしても見えない
- 64 :デフォルトの名無しさん:2015/11/14(土) 16:31:04.02 ID:1yIT8GQx.net
- 文字コード関係なし
- 65 :デフォルトの名無しさん:2015/11/18(水) 16:49:52.57 ID:UgIpz7zK.net
- すみません
今ISO-IRの資料を収集してるんですが
http://www.itscj.ipsj.or.jp/ISO-IR/232mapping.txt
の対応表ファイル持ってる方いらっしゃいませんか?
PDFはサーバーにデータ残ってるみたいで保存出来たんですが
他は消されちゃったみたいなんですよね。。。
- 66 :デフォルトの名無しさん:2015/11/19(木) 01:28:49.91 ID:Cr0FNu0Z.net
- これ?
https://www.itscj.ipsj.or.jp/iso-ir/232mapping.txt
- 67 :デフォルトの名無しさん:2015/11/20(金) 02:58:25.44 ID:n24r8VSJ.net
- 人名漢字など「文字情報基盤」約6万字の暫定私用コードと対応フォント公開 -INTERNET Watch
http://internet.watch.impress.co.jp/docs/news/20151117_731123.html
- 68 :デフォルトの名無しさん:2015/11/20(金) 16:27:32.87 ID:Q3IEXjzg.net
- >>66
そう、これです!
ありがとうございます!
ずっと
http://www.itscj.ipsj.or.jp/〜
と
http://kikaku.itscj.ipsj.or.jp/〜
の方ばかり探してたんですが、
https://の方にまだあったんですね、気付かなかった。。。
ありがとうございました。
- 69 :デフォルトの名無しさん:2015/11/21(土) 03:23:51.12 ID:YeqL1+4P.net
- gbkの ひらがな はEUC-JPと互換性がある
ひらがなが含まれてるgbkなテキストファイルを自動判別すると
EUC-JPと認識される
- 70 :デフォルトの名無しさん:2015/11/21(土) 06:36:56.04 ID:GdR6w5S8.net
- お前かお前の使ってるクソソフトが認識したことを
さも普遍的であるかのように「認識される」と書かれても
- 71 :デフォルトの名無しさん:2015/11/21(土) 14:00:50.43 ID:EEYvP2Nj.net
- >>70
EmEditor と 日本語しか対応してないものはすべて同様なんだが
英語圏の方がまとも
- 72 :デフォルトの名無しさん:2015/11/21(土) 14:57:31.75 ID:w+2inzGV.net
- 全てって…
具体名を十個挙げてみてくれ。
- 73 :デフォルトの名無しさん:2015/11/22(日) 15:40:38.08 ID:CReeeeGe.net
- 仕様と実装をごちゃ混ぜにしないでほしい
- 74 :デフォルトの名無しさん:2015/11/24(火) 07:50:30.03 ID:CRysEeOZ.net
- grepをutf16対応にして欲しいわ
- 75 :デフォルトの名無しさん:2015/11/24(火) 12:09:48.94 ID:BW2JWDBU.net
- >>73
ANSI(SJIS) / JIS / EUC(EUC-JP) / UNICODE / UTF-8
だけしか対応してないんなら仕様だろうけど
EmEditorはgbk / big5も表示可能だが自動識別はダメ
- 76 :デフォルトの名無しさん:2015/11/24(火) 16:09:46.89 ID:y63rqxtS.net
- EUC系の自動判別には限界があるってだけの話じゃないのそれ
- 77 :デフォルトの名無しさん:2015/11/24(火) 17:13:28.90 ID:AzY4Y1Jb.net
- 馬鹿に言ってもしょうがないんだよなあ
- 78 :デフォルトの名無しさん:2015/11/24(火) 21:06:35.37 ID:T8a74y+F.net
- 文字コードの仕様の話と製品の仕様(実装)の話をごっちゃにしないでください
- 79 :デフォルトの名無しさん:2015/11/25(水) 13:54:24.53 ID:5G4DFNSQ.net
- 文字化けし辛い・自動判別に強いという意味ではISO-2022-JP最強だな
- 80 :デフォルトの名無しさん:2015/11/25(水) 21:01:53.81 ID:Bzkw7eST.net
- >>74
utf-8でガマンガマン
- 81 :デフォルトの名無しさん:2015/11/26(木) 10:04:26.60 ID:esn3xG4v.net
- プログラミングやマークアップで場面によって"utf8"だったり"utf-8"だったり"UTF8"だったり"UTF-8"だったりするのは何とかならんのですかね
- 82 :デフォルトの名無しさん:2015/11/26(木) 18:52:12.64 ID:V1IifTg+.net
- >>81
それな。
動きおかしいと思ったらハイフンついてたとかある。
- 83 :デフォルトの名無しさん:2015/11/26(木) 20:23:24.34 ID:k6+g+Go3.net
- >>79
https://ja.wikipedia.org/wiki/ISO-2022-JP
独自拡張しすぎだろ
utf-8最強なのだが
Win9x時代に ANSI(s-jis) + utf-8(※s-jisに無い文字をutf-8にしてる) なんてファイル作る糞ソフトがあったな
- 84 :デフォルトの名無しさん:2015/11/26(木) 22:39:18.80 ID:i5VTRdPj.net
- >>82
utf-8に関しては-が付いてておかしくなる方がおかしい。
- 85 :デフォルトの名無しさん:2015/11/26(木) 22:43:40.69 ID:i5VTRdPj.net
- >>83
> ANSI(s-jis)
糞表現w
- 86 :デフォルトの名無しさん:2015/11/26(木) 23:24:19.12 ID:dmQOYIsX.net
- >>85
悪かったな
糞やろう。
- 87 :デフォルトの名無しさん:2015/11/26(木) 23:37:04.25 ID:o1tgPu22.net
- そんなのはプログラミングやマークアップでの指定方法の仕様次第
おかしくなると思うのはバカ
- 88 :デフォルトの名無しさん:2015/11/26(木) 23:41:50.71 ID:1gB3GczG.net
- お前が馬鹿だ
- 89 :デフォルトの名無しさん:2015/11/27(金) 07:32:51.99 ID:B8BSEsh/.net
- >>74
がまんしないで、要望をかいたほうがいいとおもう
どういうgrepがいいのかな?
コマンドですか? GUIですか?
コマンドなら、画面の環境に依存したりする
- 90 :デフォルトの名無しさん:2015/11/27(金) 15:43:44.97 ID:ssdfMMFk.net
- >>89
検索対象のデータだけでなく、
引数や端末のencoding systemも関係するからねえ。
- 91 :デフォルトの名無しさん:2015/11/30(月) 21:59:17.66 ID:jgXroiuo.net
- 「して欲しい」じゃなく自分でやってみればいいのに。
- 92 :デフォルトの名無しさん:2015/11/30(月) 22:34:12.03 ID:CwTedwfo.net
- UTF-8って日本語はほぼ3バイトだと思っていいんだっけ?
仕事仲間がそう言ってたけど不安。
- 93 :デフォルトの名無しさん:2015/11/30(月) 22:58:14.64 ID:/7/T57pL.net
- そういう曖昧な表現なら答えはyesでありnoでもあるだろう
- 94 :デフォルトの名無しさん:2015/12/01(火) 02:33:52.32 ID:juK8PVcx.net
- iconv -f Shift_JIS -t UTF-8 file_name > new_file
サイズを比較
new_fileは、file_nameより1.5倍おおきい
# 日本人にとってUTF-8がいいわけない
- 95 :デフォルトの名無しさん:2015/12/01(火) 02:44:11.35 ID:juK8PVcx.net
- ほとんど3バイト
Japanese, Chinese and Korean characters are almost entirely (if not entirely) 3 bytes on UTF-8.
3バイトは、UTF-16をつかう理由になる。
the three-byteness of CJK characters is an often-cited reason to use UTF-16 instead of UTF-8.
http://forum.dlang.org/post/hum5gl$2hfm$1@digitalmars.com
- 96 :デフォルトの名無しさん:2015/12/01(火) 03:51:29.82 ID:Ik5f2d1Y.net
- >>94-95
ファイルサイズの事を書くならもっと考慮すべきだな
UTF-8に変換するとどの程度ファイルサイズが膨らむのかは文書の内容により異なる
例えばこのスレの95までのdatファイルの場合は次のようになっていて
元のファイルに対してUTF-8は約 1.25 倍、UTF-16は約 1.5 倍だった
$ wc -c 1444822140-*
26775 1444822140-cp932.dat
40234 1444822140-utf16.dat
33434 1444822140-utf8.dat
ワープロなどの独自形式の内部でUCS2を使うことは十分に意味があると思う
しかしSHIFT_JISのプレーンテキストを変換する場合は、おおよそUTF-8が最大1.5倍
なのに対してUTF-16は最大2倍になる事を忘れてはいけない
- 97 :デフォルトの名無しさん:2015/12/01(火) 10:01:27.63 ID:2Tu3vetc.net
- UTF-8で日本語が基本3バイト、はもう慣れたけど
ブログやらWikiで日本語使うと1文字につき9バイト必要なのはさすがにちょっと萎える
%E3%81%8B%E3%81%A3%E3%81%B1%E3%81%88%E3%81%B3%E3%81%9B%E3%82%93
とかたった数文字を表すのに長すぎだっての。
文字コードというかUTF-8をパーセントエンコーディング?する時の問題だけれど。
- 98 :デフォルトの名無しさん:2015/12/01(火) 19:29:51.08 ID:k1p/Pdr9.net
- パーセントエンコーディングって単語自体が長くてめんどい。
もっと短く、パンコとかで通用するようにならないかな。
- 99 :デフォルトの名無しさん:2015/12/01(火) 20:03:05.10 ID:ampHwdqN.net
- 別に人が手作業でやってるわけじゃないのに
なにぶつぶつ言ってるんだろ
- 100 :デフォルトの名無しさん:2015/12/01(火) 20:18:47.62 ID:cchxtPU5.net
- >>94
そんな程度のことでutf-8を辞める訳にはいかない。
- 101 :デフォルトの名無しさん:2015/12/01(火) 20:40:03.81 ID:RA+mqEJ1.net
- >>99
完全に隠蔽されてりゃいいけど
日常生活で目に入ってしまうんだから
糞としか言いようがない
- 102 :デフォルトの名無しさん:2015/12/01(火) 22:44:13.88 ID:/t42lLyY.net
- URLのパーセントエンコーディングは脆弱性の宝庫になるくらいでただ使う側としてはどうでもいいけど
punycodeはまじでやめろ
- 103 :デフォルトの名無しさん:2015/12/01(火) 23:03:02.39 ID:csnzGfyE.net
- なんでやめないといけないぷに?
いいじゃないかぷに。
- 104 :デフォルトの名無しさん:2015/12/02(水) 01:31:49.86 ID:3/uIxAsF.net
- 日本語のソート順くらい日本人に決めさせろや
- 105 :デフォルトの名無しさん:2015/12/02(水) 09:35:48.18 ID:wYxvpGTD.net
- 人の感覚じゃなくて、機械的な感覚がないと・・・
- 106 :デフォルトの名無しさん:2015/12/02(水) 10:05:36.38 ID:amR8vvu9.net
- >>104
提案しろよ。
そもそも読みがわからんとソート出来ないのが日本語なんで、
単漢字のソート順なんて大したこだわりないだろ。
植物、人の名前なんか、音読み、訓読み、当て読みと
二種類以上あるの珍しくないからな。
- 107 :デフォルトの名無しさん:2015/12/02(水) 10:18:22.35 ID:wYxvpGTD.net
- JISコードに頼ったソートも今のコンピュータ環境じゃ、笑・・・・
脆弱性ってのは未熟もんがやるからとかでは
やりこんでる人でもバグは残ることも あ・・・
- 108 :デフォルトの名無しさん:2015/12/02(水) 13:55:56.97 ID:NJ9kFAss.net
- 日本語のソート順で思い出したが、
JIS(X 0208)が第1水準と第2水準で違う並べ方してるのも意味分からん。
代表音訓でも部首画数順でもいいから統一して欲しかった。
- 109 :デフォルトの名無しさん:2015/12/04(金) 12:30:36.89 ID:ujmgtERp.net
- 最近勉強し出したのか?
ソート順は確かに面倒だけど他の仕様との絡みを知ればこうするしかないと思う。
理想は理想で持っておけばいいんじゃね?
将来、漢字表刷新するかもしれんし、シフトJIS死滅するかもしれんし。
- 110 :デフォルトの名無しさん:2015/12/04(金) 12:38:17.66 ID:kxI+vXrK.net
- シフトJIS死滅するのは構わないが、漢字の文化的側面を理解しようともしない欧米人が適当に並べた順でソートされるのは納得いかん。
- 111 :デフォルトの名無しさん:2015/12/04(金) 12:53:33.88 ID:gpSQ8UEd.net
- でもJISコードなら希望通りのソートができるわけでもないだろ
- 112 :デフォルトの名無しさん:2015/12/04(金) 14:24:16.07 ID:616grxEX.net
- 何のために仮名文字があると思っているのか。
- 113 :デフォルトの名無しさん:2015/12/04(金) 18:29:07.64 ID:zfbjjPeM.net
- 文字コード順でソートしてるアホ
- 114 :デフォルトの名無しさん:2015/12/04(金) 20:17:25.57 ID:urrQLDlj.net
- いつまでたっても文字集合順序バカはいなくならないね。
全てのいじたいに
- 115 :デフォルトの名無しさん:2015/12/05(土) 09:09:04.31 ID:0xZl9ZTr.net
- 半角カタカナで読みもかいておく。ひとにかいてもらうとかまぁたいへんだけど…
昇順にするとき、半角カタカナで比較して行を並べ替える
- 116 :デフォルトの名無しさん:2015/12/05(土) 10:43:28.38 ID:oE97tTMi.net
- なんでメモ蝶を保存するときに
シフトジスでなくアンジーって表示されてんの?
- 117 :デフォルトの名無しさん:2015/12/05(土) 11:20:47.89 ID:VAg3AW+y.net
- >>116
アメリカ人がバカだから
- 118 :デフォルトの名無しさん:2015/12/05(土) 19:58:46.22 ID:kjmBg6FK.net
- >>117
Unicodeもね。
なんで符号化方式の名前じゃなくて制定した組織の名称なのかは謎。
しかも日本語環境ならANSI(=ASCII)ですらないっていう嘘表記。
- 119 :デフォルトの名無しさん:2015/12/05(土) 20:50:07.85 ID:K2AVyHLa.net
- >>116
あれアンジーって読むのか。
なんとなくアンザイとかだと思ってた。
- 120 :デフォルトの名無しさん:2015/12/06(日) 00:47:45.72 ID:ods/Bdie.net
- 英語でもWindows-1252であってANSI関係ないけどなー
後にISO/IEC 8859-1になるものが昔ANSIのドラフトとして提案されてたってのが名前の由来らしいけど
Windowsのはそれ更に独自拡張したやつだし
- 121 :デフォルトの名無しさん:2015/12/06(日) 09:58:13.03 ID:pIhfFp+J.net
- >>119
普通はアンシだけど、調べてみたらアンジでもいいみたい。
アンシ以外は聞いたことがなかった。
- 122 :デフォルトの名無しさん:2015/12/06(日) 10:48:45.84 ID:snTz5MuC.net
- お前らも意味不明な文章を見たときに
「日本語でおK」って言うだろ?
それと同じ事だ
- 123 :デフォルトの名無しさん:2015/12/06(日) 11:36:05.85 ID:jSbqCg57.net
- 答えるの面倒な質問だよなw
ANSI==932じゃない
Winowsが繁体字版なら950で保存される
- 124 :デフォルトの名無しさん:2015/12/06(日) 12:39:48.92 ID:61iq3tHI.net
- >>120
8859-1だけじゃなくて8859の8bit使うコーディングシステムの変種という理解だろうね。
- 125 :デフォルトの名無しさん:2015/12/07(月) 08:05:52.84 ID:jRU2iLzO.net
- >>120
なるほど。
ドラフトに噛んでただけなのか
- 126 :デフォルトの名無しさん:2015/12/09(水) 07:55:39.86 ID:jI2VmBLr.net
- というか昔はANSIが決めてISOが追認って規格がたくさんあった。
アメリカではANSIの規格名で呼び続けることもあった。
- 127 :デフォルトの名無しさん:2015/12/09(水) 08:29:25.15 ID:Kwr/X5Fv.net
- ほうほう、シフトジスもANSIが決めたのですか
それは初耳です
- 128 :デフォルトの名無しさん:2015/12/09(水) 09:52:29.63 ID:jI2VmBLr.net
- >>127
>>124みたいな話でしょ
- 129 :デフォルトの名無しさん:2015/12/09(水) 16:27:04.50 ID:lqAlbDFw.net
- カメラのフィルムに書いてある数字のこと昔はASA感度って言ってたのに気が付いたらISO感度ってみんな言うようになってたなみたいな話かna
- 130 :デフォルトの名無しさん:2015/12/09(水) 22:54:10.41 ID:wiCS3usg.net
- 朝感度
磯感度
- 131 :デフォルトの名無しさん:2015/12/10(木) 08:01:54.07 ID:XGY4goXY.net
- >>127
えっ!?何言ってんの⁇
- 132 :デフォルトの名無しさん:2015/12/18(金) 18:25:49.47 ID:HJbW+QnG.net
- >>108
NDL-70のマネだからな
http://www.wdic.org/w/WDIC/NDL-70
- 133 :デフォルトの名無しさん:2015/12/19(土) 00:00:59.61 ID:CW6jl8Ze.net
- 第一水準のなんでこの漢字訓読みなんだって漢字もそれ由来なん?
- 134 :デフォルトの名無しさん:2015/12/19(土) 09:33:24.36 ID:HazuH4Vs.net
- たとえばおしえて
- 135 :デフォルトの名無しさん:2015/12/19(土) 22:28:28.39 ID:dMkmHKK1.net
- NDL-70の「扱」は「圧」と「安」の間
- 136 :デフォルトの名無しさん:2015/12/20(日) 02:41:57.27 ID:YliIi6mv.net
- あっあっあん
- 137 :デフォルトの名無しさん:2015/12/20(日) 10:16:50.75 ID:XCzWC+ME.net
- しごく
こく
- 138 :デフォルトの名無しさん:2015/12/20(日) 10:19:07.37 ID:XCzWC+ME.net
- 音読みが表外
- 139 :デフォルトの名無しさん:2016/01/01(金) 03:45:50.30 ID:doWmnGIT.net
- あけまして
- 140 :デフォルトの名無しさん:2016/01/01(金) 10:51:09.09 ID:w8UZcEt0.net
- しめました
- 141 :デフォルトの名無しさん:2016/01/01(金) 23:48:50.10 ID:AG0KIon8.net
- ISO/IEC 10646のAmd.はもう無料公開されないのかしら
- 142 :デフォルトの名無しさん:2016/01/03(日) 11:09:11.17 ID:dkSYzm34.net
- 安岡センセイ絶賛ステマ中
http://srad.jp/%7Eyasuoka/journal/599105
>MZ-80Kの文字コードはなぜ変態的だったのか
- 143 :デフォルトの名無しさん:2016/01/06(水) 19:04:13.23 ID:JzbnS0qc.net
- 年寄りの昔話だな
- 144 :デフォルトの名無しさん:2016/01/06(水) 20:12:47.63 ID:iuDSHbH+.net
- 書き起こして記録しておくことは大切
- 145 :デフォルトの名無しさん:2016/01/06(水) 20:53:18.67 ID:PPpC6D2R.net
- 確かに。
- 146 :デフォルトの名無しさん:2016/01/15(金) 16:58:58.27 ID:KQq8mMFq.net
- 特定機種の話でアレだが
スマホのXperiaがZ4かZ5か知らんけどUnicodeの補助文字(BMP外の文字)表示出来るようになってたわ
俺のZ3では豆腐でがっかりだったのに、いつの間に。
- 147 :デフォルトの名無しさん:2016/01/15(金) 18:41:54.97 ID:P2RUw3PT.net
- 豆腐になるっていうのは普通に考えると
表示能力はあるけどフォントが無いだけだからフォント入れれば済む話では
- 148 :デフォルトの名無しさん:2016/01/16(土) 01:02:26.88 ID:JNkmPv0K.net
- 何個の豆腐かにもよるんじゃなかろうか
- 149 :デフォルトの名無しさん:2016/01/19(火) 13:39:56.61 ID:dtt1X0Ve.net
- http://srad.jp/%7Eyasuoka/journal/599766
安岡センセイ荒れてるけど
Unihanフリーだから論文に使ってもいいんじゃないの?
- 150 :デフォルトの名無しさん:2016/01/19(火) 20:31:34.42 ID:AH+kA+fr.net
- 使ったならちゃんとそう書けって話で
使うなということではない
- 151 :デフォルトの名無しさん:2016/01/22(金) 19:46:47.72 ID:Eb9O6glo.net
- [要出典]
てか
- 152 :デフォルトの名無しさん:2016/01/22(金) 20:00:04.23 ID:QBUelO2B.net
- アホの安岡が
『「常用漢字表と人名用漢字表を元にしてテキストを作成した[1]」のが事実なら』
と鍵かっこで強調してるというのに
日本語も読めないのかこの馬鹿(>151)は
- 153 :デフォルトの名無しさん:2016/01/25(月) 22:08:23.80 ID:hLxKxz0/.net
- Unicodeには常用漢字表も人名用漢字表も含まれてるから、
結局のとこ、Unihanで無問題な希ガス
- 154 :デフォルトの名無しさん:2016/01/25(月) 22:37:19.56 ID:1JcfbMU3.net
- そんな甘い考えでやっちまったんだろうなあ
- 155 :片山博文MZ ◆T6xkBnTXz7B0 :2016/01/29(金) 15:58:28.60 ID:BQRaRgTF.net
- 与えられたテキストがUCS16に合致するか判定するアルゴリズムってある?
- 156 :デフォルトの名無しさん:2016/01/29(金) 16:42:21.91 ID:aBCIPjTo.net
- iconvはルールが厳しいから
入ロクおかしければ変換失敗する
- 157 :片山博文MZ ◆T6xkBnTXz7B0 :2016/01/30(土) 22:17:33.35 ID:4i/PfDlC.net
- nkfは、ライブラリとしては中途半端なんだよな。
スタティックライブラリとして利用可能にしてほしい。
- 158 :デフォルトの名無しさん:2016/01/31(日) 00:56:53.78 ID:1gNPM3q2.net
- nkfって厳密さより何となく動くこと重視してるし
変換も自然とは言いがたい独自なのあるから注意
- 159 :デフォルトの名無しさん:2016/02/01(月) 00:21:45.94 ID:AuVBRc/d.net
- ほええそういうものなのか
- 160 :デフォルトの名無しさん:2016/02/03(水) 21:14:57.17 ID:uf0uQxAG.net
- シフトJISを作るときに2バイト目が0x00-7Fを避けるようにはできなかったのかな?
こうすればダメ文字問題も起こらないのに。
- 161 :デフォルトの名無しさん:2016/02/03(水) 21:41:36.87 ID:Fx9BpiPG.net
- >>160
半角カナは1バイト
漢字は2バイト
って制約があるから無理
- 162 :デフォルトの名無しさん:2016/02/03(水) 21:50:14.56 ID:mmJ5x1I8.net
- >>161は会話のできないあすぺ
- 163 :デフォルトの名無しさん:2016/02/03(水) 21:58:17.93 ID:mmJ5x1I8.net
- できなくはなかっただろうな
FFと1バイト目の半角カナを避けても
63×127=8001文字は使える
- 164 :デフォルトの名無しさん:2016/02/03(水) 23:45:43.20 ID:uf0uQxAG.net
- Unicodeがあるのに今さらという感じはするけど
半角文字は1バイト全角文字は2バイトのままで
2バイト目が00-7Fにならない新文字コードがあってもいいと思う。
- 165 :デフォルトの名無しさん:2016/02/03(水) 23:58:17.15 ID:FE/plTpc.net
- そして三水四水を入れる領域が足りなくなり後のMSに恨まれると。
- 166 :デフォルトの名無しさん:2016/02/04(木) 12:35:29.01 ID:NB0syLHO.net
- >>164
文字コードと符号化の違い分かってる?
そもそもシフトJISをサポートしてないソフトでシフトJISを使ったら問題出たってだけでしょ
- 167 :デフォルトの名無しさん:2016/02/04(木) 13:06:32.74 ID:dTOEAfAy.net
- >>164
もう全く必要ない
- 168 :デフォルトの名無しさん:2016/02/04(木) 14:58:00.09 ID:pUsIARbq.net
- シフトJISの反省の上に?作られたのが0x00-7FをASCIIにしか使わない日本語EUC(EUC-JP)なんだから
それでいいじゃんって気がするのだけど
そんなに半角カナが大事か
>>163
ISO/IEC 2022の94*94を47*188に変換するって分かりやすさ優先でこうなったんだっけ?
- 169 :デフォルトの名無しさん:2016/02/04(木) 16:01:14.78 ID:dTOEAfAy.net
- >>168
EUCはISO 2022ルールに則っとってる
ISO 2022はすでに存在した
半角カナも使える
- 170 :デフォルトの名無しさん:2016/02/04(木) 19:20:10.85 ID:EFnVMbsO.net
- >>169
>>168は半角カナを1バイトに納めることがそんなに優先かと言ってる
>>168
確証は無いけど、分かりやすさ・計算の単純さ優先の結果だと思ってた
- 171 :デフォルトの名無しさん:2016/02/04(木) 23:06:09.90 ID:WWqaejBP.net
- >>166
もっと昔からある EUC を処理するには 8ビットクリーンなプログラムであれば事足りる。
ISO 8859 もそうだ。だからコンパイラも特別な処理などしなかった。
シフトJISもそうできなかったのかという話じゃないのか?
- 172 :デフォルトの名無しさん:2016/02/04(木) 23:35:33.23 ID:gW2sFWg4.net
- むしろ解釈できない文字コードを通すことがおかしい
たまたま問題が見つからなかった、コンパイラがエラーを出さずに処理を終えたからOKとするなんてアホ
- 173 :デフォルトの名無しさん:2016/02/05(金) 02:34:16.13 ID:EN3ElRH3.net
- >>171
8ビットクリーンならEUC-JPを問題なく使えるかというとそうでもなくて
上位バイトと下位バイトが別れちゃう問題は発生しうる
シフトjisの「表」のあとに\を入れるみたいなバッドノウハウが目立つのでシフトJISに
問題があるように見えるのかもしれないけど、本質的には対応してないものを
勝手に使って文句言ってるだけじゃないかな
- 174 :デフォルトの名無しさん:2016/02/05(金) 02:44:24.24 ID:k2yclqL8.net
- 上位バイトと下位バイトが別れる件はダメ文字とは別件だから
最初の人の要求に対しては問題にならない
- 175 :デフォルトの名無しさん:2016/02/06(土) 14:03:11.00 ID:sR9TSGCJ.net
- >>173
対応してないから出来ないなんてことが起こるのはシフトJISだけだよ。
ダメ文字のせいで正規表現すら書けない。誰もやりたがらないような裏技はあるけどね。
- 176 :デフォルトの名無しさん:2016/02/06(土) 15:14:13.70 ID:zVjqWScH.net
- 自分が間違ったやり方をしていたけど問題になったのはAだけだ
→だからAが悪い
まさにこういう発想がクソ
しかも自分の知っている文字コードが全てだと勘違いしていてたちが悪い
- 177 :デフォルトの名無しさん:2016/02/06(土) 15:45:39.28 ID:P3+owK3w.net
- ビットマップのフォントデータ(16×16)を使って
レトロな電光掲示板を作ってみよう、と思う
http://i.imgur.com/owubbp4.png
- 178 :デフォルトの名無しさん:2016/02/06(土) 18:59:39.30 ID:Ps0oIAyd.net
- UTF-8なら漢字やかなに00-7Fは使わないけどな
って、そういう話をしてるわけじゃないのか。
- 179 :デフォルトの名無しさん:2016/02/06(土) 19:36:29.58 ID:uSRKfZgb.net
- >>176
しかしShift JISはかなり質が悪い
- 180 :デフォルトの名無しさん:2016/02/06(土) 19:41:15.78 ID:MiOvJZDJ.net
- どうしてWindowsは出来の悪い方ばっかり選択するんだろうか
cp932といいUTF-16といい…
- 181 :デフォルトの名無しさん:2016/02/06(土) 20:34:21.53 ID:sR9TSGCJ.net
- >>178
そういう話をしてるつもりだけど、そうでない人もいるようだ。
- 182 :デフォルトの名無しさん:2016/02/07(日) 08:00:22.03 ID:+iI8pPYd.net
- エスケープシーケンスよりCP932の方がまだマシだし、
CP932よりUCS-2の方が多少はマシだったからでしょ
- 183 :デフォルトの名無しさん:2016/02/07(日) 13:34:15.00 ID:COqNuXpv.net
- >>173
今更だけど、文字が分断される可能性についても公平を期すために触れておくよ。
単純にバイト数で分割する場合等を除けば、ほとんどはパターンマッチにおける誤マッチが原因だろう。
strchr や strstr 、あるいはもっと高度なライブラリを使った結果かもしれない。
探すパターンに [\100-\176] にマッチする文字が含まれているなら EUC では誤マッチは起こらない。
シフトJISではダメ文字のせいで誤マッチが起こりうる。
実際に問題になるのはほとんどがこのケース。
grep "\]"
などとやろうものなら悲惨なことになる。
探すパターンがマルチバイト文字だけなら EUC でもシフトJISと同程度には誤マッチが起こりうる。
しかし実際にはほとんど起こらない。
もちろん起こるときは起こるし対策も出来るが対策は速度の低下と引換だ。
30 年前の CPU クロックは 10MHz 程度だったので速度も重要だった。
ほとんど起こらない上に致命的でもないなら速度を犠牲にしてまで常に対策を講じる必要は無い。
ちなみに対策だが、EUC で grep する場合なら
egrep "^([\000-\177]|\216[\240-\337]|\217[\241-\376][\241-\376]|[\241-\376][\241-\376])*$pattern"
的なことをするプログラムを grep_euc とかそういう名前で作っておけばいい。
シフトJISの場合はこれに加えてシフトJISな部分を 8 進エスケープシーケンスに置き換える必要がある。
同じやり方で iso-2022-jp も処理できる。
シフトJISしか通さない grep など技術的には邪魔なだけだよ。
- 184 :デフォルトの名無しさん:2016/02/07(日) 13:49:06.41 ID:GW5WZ8T2.net
- >>183
長文の駄文乙
文字処理を文字単位でなくバイナリデータで行うのをやめた方がいいぞ
- 185 :デフォルトの名無しさん:2016/02/07(日) 15:37:08.80 ID:F/ILMG/l.net
- >>183
"\]"←おおESC、これでアニメ作ったもんじゃ
>>184
ビット操作は頭の体操になるよ↓
http://i.imgur.com/ibjeaA8.png
- 186 :デフォルトの名無しさん:2016/02/07(日) 20:14:33.59 ID:lDI02uIo.net
- grepはいつutf16対応してくれるんじゃぁ
ふだんLinux使ってるんだがwinのソースコードはなぜかutf16なんでいつも困っとるんじゃぁ
nkfで変換するのめんどいんじゃあ
- 187 :デフォルトの名無しさん:2016/02/07(日) 21:05:14.46 ID:+iI8pPYd.net
- utf16のそーすとか見たこと無いな
- 188 :デフォルトの名無しさん:2016/02/08(月) 01:36:20.73 ID:0XuKQtD5.net
- >>180
UTF-16はそのころUCS-2しかなかったんだから仕方ないやろ
個人的にWindowsはAとWはそのままでもいいから
標準CライブラリとC++ライブラリはUTF-8を使ってくれるようにしてくれれば不満ないんだけどな。
- 189 :デフォルトの名無しさん:2016/02/08(月) 05:19:47.55 ID:x/5r9wp6.net
- >>188
全然仕方なくないどころか、むしろまた先走ってやっちまったとしか
- 190 :デフォルトの名無しさん:2016/02/08(月) 09:34:53.73 ID:AxqrebA9.net
- UTF-16固定とか基地外沙汰
ackやagもUTF-16は華麗にスルー
- 191 :デフォルトの名無しさん:2016/02/08(月) 22:30:39.07 ID:ti0XuUyR.net
- EUCは目糞鼻糞だし、当時の記録媒体でUTF-8とか頭おかしいレベルなのに
一体どうしたかったのか
- 192 :デフォルトの名無しさん:2016/02/08(月) 22:35:16.47 ID:HMUrPVh/.net
- ただマイクロソフトを非難したいだけのキティGUYに何を。
こういうのは誰でもいいから攻撃対象を設けてガス抜きさせてやらないといかん。
- 193 :デフォルトの名無しさん:2016/02/08(月) 23:02:30.93 ID:sawB/DI+.net
- SHIFT_JISよりEUC-JPの方がマシ、UTF-16よりUTF-8の方がマシってだけでしょ
マイクロソフトを非難したいだけに見えるとしたら相当なバイアス掛かってると思うよ
- 194 :デフォルトの名無しさん:2016/02/09(火) 00:48:21.70 ID:TCPuRlam.net
- >>191
> 当時の記録媒体でUTF-8とか頭おかしいレベルなのに
kwsk
と言っても
> EUCは目糞鼻糞だしょ
なんて言ってる奴のいうことが理解できるかどうか…
- 195 :デフォルトの名無しさん:2016/02/09(火) 05:16:13.78 ID:K12Uxl59.net
- UTF-8のRFCが出たのは2003年
その頃には80GBのHDDを一般人が変える時代
テキストの容量が問題になるとか無いわ
個人的にはいつまで経ってもsetlocaleでUTF-8を指定出来ない、代替の方法も用意されないWindowsは非難されて当然だと思うけどな。
- 196 :デフォルトの名無しさん:2016/02/09(火) 07:15:08.73 ID:4WJVGAJH.net
- Windowsの今の文字コードの設計のベースは1991年か1992年に
Unicode1.0.0をもとに作られたはず
ちなみにその頃から「〜」はU+FF5Eに存在した
- 197 :デフォルトの名無しさん:2016/02/09(火) 07:20:39.41 ID:AjhTI0tJ.net
- 当時の記録媒体言ってるのはWindowsNTの時代な
その当時にUTF-8みたいな実装してもアホでしょ
それとUTF-8を率先して使用してる理由ってEUC環境が糞だったからでしょ
EUC環境の時代って外人様のソフトウェアで漢字の表示すらままならなかったよね
- 198 :デフォルトの名無しさん:2016/02/09(火) 07:37:26.98 ID:AjhTI0tJ.net
- まあなんにせよUnicodeでデータ交換できるようになって
EUCゴミ環境が消えテクノは良い事だわ
EUCありがとうバイバイ
- 199 :デフォルトの名無しさん:2016/02/09(火) 08:47:31.92 ID:K12Uxl59.net
- 同じようにWindowsのCP932もさっさと消えてほしいんだけどな
- 200 :デフォルトの名無しさん:2016/02/09(火) 11:12:55.58 ID:nhb546WZ.net
- 今でも新規作成の全文章を統計取ると、
cp932の方が多いんじゃないか。
結局全くプログラムかかないひとが
何の文字コード使ってるかが焦点で、
プログラム書く人間の文字コードなんざ焦点じゃないんだよね。
- 201 :デフォルトの名無しさん:2016/02/09(火) 11:31:59.64 ID:gJW4evIq.net
- >>200
最多はwordでunicodeでしょ
ちなみにwordをunicode化したのは日本人
- 202 :デフォルトの名無しさん:2016/02/09(火) 11:32:56.66 ID:gJW4evIq.net
- MSは昔からAPIを移行改善していくのが下手
- 203 :デフォルトの名無しさん:2016/02/09(火) 22:21:12.66 ID:K12Uxl59.net
- 電話用のWindowsもCP932とUTF16ならそのまま安らかに死んでほしいんだけどどうなん?
- 204 :デフォルトの名無しさん:2016/02/09(火) 22:44:37.32 ID:AjhTI0tJ.net
- 死ぬことはないよ
生まれてすらいないからね
- 205 :デフォルトの名無しさん:2016/02/10(水) 05:29:25.59 ID:ShaMeiRT.net
- 産まれる前に死ぬってあると思うけど?
- 206 :デフォルトの名無しさん:2016/02/10(水) 20:10:05.19 ID:NIAqtvX5.net
- 文字コードはUnicodeで統一されつつあるけど
改行コードが統一される動きはないよな
- 207 :デフォルトの名無しさん:2016/02/10(水) 20:11:34.12 ID:jTWkF3R0.net
- >>187
英語だけなら問題ないが日本語でコメントかくととたんにやっかい
おそらくwinの内部処理がutf16なんでvcでコンパイラ作る→utf16しか受け付けない
になるんだと思う
- 208 :デフォルトの名無しさん:2016/02/10(水) 20:14:06.58 ID:DqOeVQNQ.net
- 何言ってんだこいつ
- 209 :デフォルトの名無しさん:2016/02/10(水) 20:19:14.56 ID:urcLBA+T.net
- おまえはお馬鹿な発言する人にいつもくってかかるのか
- 210 :デフォルトの名無しさん:2016/02/10(水) 20:27:11.86 ID:jTWkF3R0.net
- >>208>>209
バカ乙
- 211 :デフォルトの名無しさん:2016/02/10(水) 20:58:07.57 ID:DqOeVQNQ.net
- 絵に描いたような「バカと言う奴がバカ」
- 212 :デフォルトの名無しさん:2016/02/10(水) 22:46:23.85 ID:MNP/EF3f.net
- 最近のMSVCはUTF-8のソースコード食ってくれるよ
新しくMSVCで読み込んだソースがUTF-8なのにBOMがないと自動判定に失敗して意味不明なコンパイルエラーになることも多いけど
- 213 :デフォルトの名無しさん:2016/02/11(木) 00:53:59.61 ID:V6zkYN3z.net
- >>206
そうか?
ローカルデータで復帰付けてるのWindowsくらいじゃないか?
HTYP, SMTPなんかは復帰改行だけど
- 214 :デフォルトの名無しさん:2016/02/11(木) 21:55:56.34 ID:xlY9kt9Q.net
- 1バイトの英数字を平仮名と同じ幅で表示するフォントがあれば
全角英数字は使わないと思うんだが全角英数字も互換性のためだけに残されていると考えていいのか
- 215 :デフォルトの名無しさん:2016/02/11(木) 23:11:32.22 ID:e91ojKTo.net
- >>214
JIS X 0208は、ASCIIやJIS X 0201と併用せずに使うことも想定されてる
だから文字集合に英数記号が含まれるのは当然
併用する場合ISO 2022的には重複符号化禁止だから本来使っちゃいけない
けど運用では守られてなかったし、併用前提の文字コードもあった
Unicodeは過去の利用例をほぼ取り込むのが前提だから
互換文字として全角文字を取り込んだ
- 216 :デフォルトの名無しさん:2016/02/11(木) 23:19:16.34 ID:sKuqfOHl.net
- ではU+3000が互換文字領域に無いのは何故なんだぜ
- 217 :デフォルトの名無しさん:2016/02/11(木) 23:22:30.10 ID:e91ojKTo.net
- なんとか空白はどうしても入れたい奴があったから全部入れることにしたんじゃないのかね
最初から20種類くらいあったでしょ
- 218 :デフォルトの名無しさん:2016/02/12(金) 00:18:36.22 ID:VRdJSDW+.net
- つまり全角を貫いたおおたさん大勝利ってことだな
- 219 :デフォルトの名無しさん:2016/02/12(金) 14:58:04.35 ID:E8URvzDX.net
- 空白もそうだけど横棒も統合せずに放り込んだのが多すぎ
U+2015 HORIZONTAL BARってどこから生えて来たんだろ
- 220 :デフォルトの名無しさん:2016/02/12(金) 22:43:58.37 ID:06flQvvq.net
- VERTICALなら生えてきそうだけどHORIZONTALに生えるイメージは無いな
- 221 :デフォルトの名無しさん:2016/02/13(土) 10:24:02.68 ID:vrowrAaX.net
- ————
――――
- 222 :デフォルトの名無しさん:2016/02/13(土) 21:46:29.51 ID:UfGCg9+I.net
- >>211
先に208でバカにしてきたのは208なんだが語るに落ちてねーか?
それとも「バカという単語は書いてないから自分はセーフ」ってことだろうか
バカの考えることはわからん
- 223 :デフォルトの名無しさん:2016/02/13(土) 21:50:44.90 ID:DWYdQVEl.net
- バカの考えること=お前の考えること
自分が何考えてるかもわかんないなら救いようがないな。清原と一緒に逮捕されてろ
- 224 :デフォルトの名無しさん:2016/02/15(月) 00:32:04.19 ID:ntkpNKWd.net
- >>212
もうすぐUpdate2で改善されるからそれまで待て
- 225 :デフォルトの名無しさん:2016/02/15(月) 16:58:33.36 ID:4pgZ8RvT.net
- >>221
上がU+2014 EM DASHで
下がU+2015 HORIZONTAL BAR?
EM DASHは並べても切れて見えるなフォント次第だろうけど
- 226 :デフォルトの名無しさん:2016/02/16(火) 07:17:36.55 ID:XdPvZNKx.net
- >>223
なんだ適当に言葉並べてるだけか
人工無能の方がマシだなこりゃ
おバカさん
- 227 :デフォルトの名無しさん:2016/02/20(土) 22:49:46.68 ID:2GCqu0fo.net
- MS-excelのcodeという関数の出力がShift-JISだと勘違いしていた初心者の俺。
あやうく大恥をかく前に気づいてセーフ。
- 228 :デフォルトの名無しさん:2016/02/24(水) 01:54:36.77 ID:hnpOvXF7.net
- UNICODEが年々キモくなるんですけど、新しいモジコードは開発されていますか(´・ω・`)?
- 229 :デフォルトの名無しさん:2016/02/24(水) 12:06:50.24 ID:9rhAu1z5.net
- >>228
君の出番だよ
君が第二の坂村健だ
- 230 :デフォルトの名無しさん:2016/02/24(水) 17:55:57.73 ID:zehZo7UI.net
- 完成してMicrosoftとAppleとGoogleとLinuxが採用したら知らせてくれ
- 231 :デフォルトの名無しさん:2016/02/24(水) 20:07:26.11 ID:Tso1kbi5.net
- バイトオーダーがややこしいから1byteを1bitにするか
逆に1byteを64bitなどの大きい値にしたらどうよ?
コンピューターの黎明期は1byteが8bit以外の物もあったんだから
それも不可能ではないだろう。
- 232 :デフォルトの名無しさん:2016/02/24(水) 20:26:02.29 ID:JXxoXIUe.net
- 馬鹿って馬鹿だよね
- 233 :デフォルトの名無しさん:2016/02/25(木) 00:25:47.28 ID:loBITXzr.net
- >>231
コンピュータの黎明期はbyteと云う単位ではなくて、Wordという単位だったと
思いますよ。1word何byteとかいっていて、コンピュータによって、Wordのbit数が
違っていたように思います。
大体1短Wordが20bit+1符号bit,1長wordが短wordの2倍で40bit+1符号bitというのが
普通だったとおもいますが、CDCの3600は、1短wordが32bit、1長wordが64bitではなかった
かと思います。
なにしろ、1960年代のことなので、記憶違いがあるかもしれません。
- 234 :デフォルトの名無しさん:2016/02/25(木) 20:46:03.90 ID:BzGy0Z9t.net
- Unicodeに何が追加されようと大半の日本語フォントはAdobe-Japan1-6準拠だから
ほとんど恩恵がない
AdobeはPanCJKなんて漢字マニアしか喜ばないものを作ってないで
そろそろAJ17に取り掛かってくれ
- 235 :デフォルトの名無しさん:2016/02/26(金) 12:15:47.32 ID:YTHIspbV.net
- Wordは今でも使うだろ普通に。
昔あったのはWord機、生き残りがByte機。
- 236 :デフォルトの名無しさん:2016/02/26(金) 17:03:45.40 ID:iAHBb9xH.net
- >>152
安岡センセイ大敗北w
http://srad.jp/%7Eyasuoka/journal/600756
- 237 :デフォルトの名無しさん:2016/02/26(金) 19:35:56.60 ID:Ckpzri88.net
- >>235
byteかwordかというのは
アドレッシング
アクセス最小単位
アラインメント
と3つの軸があって
最後のはbyte単位でないのが主流
- 238 :デフォルトの名無しさん:2016/02/26(金) 19:54:30.62 ID:d58rhTQn.net
- キモはアルゴリズムでデータソースでしかないものに文句つけてもイチャモンでしかないだろう
知らんけど
- 239 :デフォルトの名無しさん:2016/02/26(金) 21:57:25.44 ID:jlaESRTF.net
- アルゴリズムもバグってるみたいよ
- 240 :デフォルトの名無しさん:2016/02/27(土) 01:15:53.58 ID:1kXiMiWp.net
- >>237
アーキテクチャ上は最後のも大丈夫なんじゃないの?
メモリにアクセスするハードウェア側のインタフェースの話じゃないよね。
- 241 :デフォルトの名無しさん:2016/03/02(水) 11:22:17.92 ID:5SSZmY+T.net
- カタカナが多すぎて頭こんがらんがってきた
- 242 :デフォルトの名無しさん:2016/03/02(水) 13:37:01.48 ID:H2CN+/B0.net
- トゥゲザーしようぜ
- 243 :デフォルトの名無しさん:2016/03/02(水) 13:52:03.06 ID:Pi6Moa3o.net
- シェアしたいと思います
- 244 :デフォルトの名無しさん:2016/03/04(金) 11:07:29.81 ID:aAJqKKxk.net
- 1文字に32bit使うなら一般的な組み合わせの合成文字は
全て合成済み文字にしてコードを割り当てても足りるんじゃないだろうか
そうして合成文字は外字のようなオプション的な扱いにしたらいいと思うんだけどね
- 245 :デフォルトの名無しさん:2016/03/04(金) 11:29:46.53 ID:ex0V5X9T.net
- 何のいみがあるのかわからんなあ
- 246 :デフォルトの名無しさん:2016/03/04(金) 12:41:46.94 ID:aAJqKKxk.net
- >>245
一般的な文字では32bit固定長にできる
- 247 :デフォルトの名無しさん:2016/03/04(金) 13:27:03.56 ID:qO6Wo8x7.net
- 「一般的な組み合わせ」が不変ならいいけど、現実にはいくらでも流動しちゃうのが問題じゃないかな。
これまでにも「今の用途ならこれだけあれば十分」って感覚で半端に作られた負の遺産がたくさんあるよね。
合成文字の仕組み自体を全廃・強制力付きで禁止するのならともかく、
オプションとして残すのなら新たに余計なものを作っただけで終わるのが見えてる。
- 248 :デフォルトの名無しさん:2016/03/04(金) 18:21:11.26 ID:IERVyLvo.net
- ISO/IEC 6937対ISO/IEC 8859シリーズの戦いはもう勘弁
- 249 :デフォルトの名無しさん:2016/03/15(火) 10:56:22.12 ID:ZYJuXZMf.net
- >>228
Unicodeで得られた知見を基に反省を活かして新しいのを作ってほしいね。
Unicodeもコンセプトは賛成だし規格に例外は付き物だけど、あまりにも継ぎ接ぎだらけでスパゲティコードみたいになってるのは清算したいね。
- 250 :デフォルトの名無しさん:2016/04/02(土) 13:20:35.07 ID:raCNCQWh.net
- Unicodeはバージョンアップ時に精算するのが得意な方
切り捨てバンザイ主義
これ以上切り捨てたら誰も使ってはくれない
- 251 :デフォルトの名無しさん:2016/04/06(水) 17:49:51.21 ID:APP4s98L.net
- UTS #52: Unicode Emoji Mechanisms
http://www.unicode.org/reports/tr52/tr52-1.html
> 3.5 Hair Attribute
>
> Syntax
>
> Tag-Base Hair_Base
> Tag-Key Tag-H
> Tag-Value Exactly one of the following tag-valueChars:
> tag-valueChar Description
> Tag-k Black-haired
> Tag-s Blonde (also sandy-haired)
> Tag-b Brown (Brunette)
> Tag-r Redhead (Ginger)
> Tag-g Gray-haired
> Tag-n Bald (no hair)
漫画・アニメキャラ用に赤髪、ピンク髪、緑髪、青髪、水髪、紫髪なんかも加えるべきじゃないですかね。
- 252 :デフォルトの名無しさん:2016/04/06(水) 18:29:57.08 ID:qW+LkY/S.net
- _人人人人人人人_
> Bald (no hair) <
 ̄Y^Y^Y^Y^Y^Y^Y ̄
- 253 :デフォルトの名無しさん:2016/04/08(金) 13:36:54.32 ID:9VpqQ38l.net
- Δ彡⌒ミΔ
ξ ・ェ・ ξ
ξ ξ
ξ ξ また髪の話してる。
ξ ξ
ξ 彡⌒ミ
ξ (´・ω・`)〇
ξ (| |)ξ
ξ (γ / ξ
uu〜〜〜し uu
- 254 :デフォルトの名無しさん:2016/04/09(土) 00:11:15.96 ID:QiRGiLFx.net
- 毛の色と量は別のパラメータだよね
- 255 :デフォルトの名無しさん:2016/04/09(土) 00:17:51.71 ID:EyctzspR.net
- 赤毛のつるっぱげと
黒髪のつるっぱげと
ブロンドのつるっぱげの
区別を付ける意味はあるのかなあ。
- 256 :デフォルトの名無しさん:2016/04/09(土) 01:58:16.39 ID:ncpORidQ.net
- 眉毛の色も変わるんじゃね
- 257 :デフォルトの名無しさん:2016/04/11(月) 18:05:35.93 ID:qAYYUQ+e.net
- >>251
色はスタイルシートとか他の技術で実現しろよな
そのうちRGB指定とか出てくるぞこれ
- 258 :デフォルトの名無しさん:2016/04/19(火) 18:55:29.59 ID:y8aUhLXK.net
- コンソーシアムはアホばっか。
結局駆け引きとかゲーム楽しんでるだけじゃん。
- 259 :デフォルトの名無しさん:2016/04/22(金) 16:03:00.18 ID:20ytlDG9.net
- ヘアスタイルや髪の色、眼鏡やら帽子やらはUnicodeの範囲の対象外だよとか言ってたのは何だったんだろう
- 260 :デフォルトの名無しさん:2016/04/28(木) 04:05:36.64 ID:m6Hq/pUS.net
- 完全にMark Davisに振り回されてる
- 261 :デフォルトの名無しさん:2016/04/30(土) 16:00:17.78 ID:Hd4l7uwV.net
- 禿は髪の色じゃなくてヘアスタイルだろ
てっぺん禿、後退禿、つるっ禿と種類もある
禿差別が凄い
- 262 :デフォルトの名無しさん:2016/04/30(土) 16:37:37.68 ID:n4ETaU8X.net
- ちょんまげとか辮髪とかと同列のタグだよね
- 263 :デフォルトの名無しさん:2016/05/01(日) 09:46:27.59 ID:w66eLaS8.net
- イラストのための仕様拡張なんか合理的な理由が全くないわ
文字から切り離して絵のフォーマットにすればいいじゃん
- 264 :デフォルトの名無しさん:2016/05/01(日) 11:04:17.70 ID:tKi6j9CT.net
- 匿名通信(Tor、i2p等)ができるファイル共有ソフトBitComet(ビットコメット)みたいな、
BitTorrentがオープンソースで開発されています
言語は何でも大丈夫だそうなので、P2P書きたい!って人居ませんか?
Covenantの作者(Lyrise)がそういう人と話したいそうなので、よろしければツイートお願いします
https://twitter.com/Lyrise_al
ちなみにオイラはCovenantの完成が待ち遠しいプログラミングできないアスペルガーw
The Covenant Project
概要
Covenantは、純粋P2Pのファイル共有ソフトです
目的
インターネットにおける権力による抑圧を排除することが最終的な目標です。 そのためにCovenantでは、中央に依存しない、高効率で検索能力の高いファイル共有の機能をユーザーに提供します
特徴
Covenant = Bittorrent + Abstract Network + DHT + (Search = WoT + PoW)
接続は抽象化されているので、I2P, Tor, TCP, Proxy, その他を利用可能です
DHTにはKademlia + コネクションプールを使用します
UPnPによってポートを解放することができますが、Port0でも利用可能です(接続数は少なくなります)
検索リクエスト、アップロード、ダウンロードなどのすべての通信はDHT的に分散され、特定のサーバーに依存しません
v
- 265 :デフォルトの名無しさん:2016/05/18(水) 02:04:12.61 ID:rFetSORz.net
-
彡 ⌒ ミ
(´・ω・`)
U θ U
/ ̄ ̄T ̄ ̄\
|二二二二二二二|
| |
- 266 :デフォルトの名無しさん:2016/06/07(火) 17:21:48.18 ID:zLlkZGBv.net
- http://www.unicode.org/emoji/charts/emoji-released.html#food-prepared
たこ焼きはまだか?
- 267 :デフォルトの名無しさん:2016/06/08(水) 01:10:51.52 ID:mh0+02By.net
- NAUSEATED FACEってなんや。
外人は体調悪くなるとみんな顔緑色になるんか。
- 268 :デフォルトの名無しさん:2016/06/08(水) 11:35:15.41 ID:XFtKz/Go.net
- この調子でどんどん絵文字を追加していくと
ついには新しい表意文字の体系が出来上がるよね
だけどコンピュータで扱う上では表音文字の方が合理的だったってことは
我々は痛いほどよくわかっているから、なんだかなーって気持ちになる
全ての物を一文字で表すのは大変なので
将来的に絵文字の熟語とか編み出されて
絵文字で会話するようになったらいやだなぁ
- 269 :デフォルトの名無しさん:2016/06/09(木) 11:33:55.71 ID:QkRZyBjx.net
- >>268
>全ての物を一文字で表すのは大変なので
中国人「歓」
>将来的に絵文字の熟語とか編み出されて
>絵文字で会話するようになったらいやだなぁ
中国人「可不是」日本人「成程ね」
- 270 :デフォルトの名無しさん:2016/06/20(月) 16:59:01.95 ID:KYxI40Xs.net
- ttp://d.hatena.ne.jp/NAOI/20080623/1214211959
絵文字の人物の肌の色やら髪の色を区別するならこういうのも区別してほしいわ〜。
バケツ頭かそうでないかは重要、俺的に
- 271 :デフォルトの名無しさん:2016/06/21(火) 12:33:04.97 ID:hiJvGdgU.net
- unicode例示図形の画力の低さが光る
- 272 :デフォルトの名無しさん:2016/06/22(水) 14:24:00.61 ID:veMK4+iv.net
- The Unicode Blog: Announcing The Unicode® Standard, Version 9.0
http://blog.unicode.org/2016/06/announcing-unicode-standard-version-90.html
Unicode 9.0.0
http://www.unicode.org/versions/Unicode9.0.0/
- 273 :デフォルトの名無しさん:2016/06/22(水) 16:17:18.06 ID:VKcfRnsb.net
- なんか最近どんどん数字上がってね?Chromeみたい。
どんどんメジャーバージョン上げていく理由って何?
- 274 :デフォルトの名無しさん:2016/06/24(金) 07:30:00.72 ID:DNjTkSpS.net
- >>273
絵文字量産してるからな
ろくすっぽ審議もせずどんどん入れてる
絵文字専用コードにすればいいのに
- 275 :デフォルトの名無しさん:2016/06/24(金) 21:07:43.94 ID:BJd4+ABn.net
- 本当、Unicode 1.X でやめとけば世の中平和だったのに。
- 276 :デフォルトの名無しさん:2016/06/26(日) 01:00:56.43 ID:jrvEZcpa.net
- まあ、サロゲートペアは無くても結合文字があるんですけどね……。
- 277 :デフォルトの名無しさん:2016/07/04(月) 14:48:24.44 ID:D0uzD5G8.net
- ISO/IEC 10646:2014/Amd.2:2016がいつの間にか無料公開始まってたのな。
U+301C WAVE DASHの字形がISO/IEC 10646側でもやっと修正されたのか。
- 278 :デフォルトの名無しさん:2016/07/06(水) 10:23:17.77 ID:lhUlUm2p.net
- 安岡センセイ荒れてるな
http://srad.jp/~yasuoka/journal/604190/
>UTF-8は、ASCIIコードに当たる部分は1バイトで表し、
>それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
荒れるの当然か
- 279 :デフォルトの名無しさん:2016/07/06(水) 11:21:22.67 ID:X105+0ra.net
- これはひどい
- 280 :デフォルトの名無しさん:2016/07/06(水) 19:46:06.13 ID:j7TfNCeT.net
- まじか。utf16採用してるwindows大勝利だな
(何度も言うがなんでutf8にしなかったんだよ。unixのツール使えなくてムカつくわ)
- 281 :デフォルトの名無しさん:2016/07/06(水) 20:19:51.63 ID:gBn7auOK.net
- >>280
表面はSJISだからだろ。
- 282 :デフォルトの名無しさん:2016/07/06(水) 22:02:39.94 ID:wyF/Ksyo.net
- 漢字を正確に言葉で伝えるにはコードで表現するのが最も手軽で確実だと思うのだが、
あいにく当方の職場では誰もそうしようとしない。
和文通話表もアルファベットのフォネティックコードも使わない。
何しろ管理職にそういう発想が全くないのだからどうしようもない。
今のジジババはもう駄目だ。これからの若い世代に期待したい。
コード関係者、教育関係者の皆様、文字コードの概念を広く普及させてくださいませ。
- 283 :デフォルトの名無しさん:2016/07/06(水) 22:43:23.48 ID:7tNa29hq.net
- >>278
合ってるで
- 284 :デフォルトの名無しさん:2016/07/06(水) 23:02:26.86 ID:73ByLRkJ.net
- 文字コードの話題で、他の規格に不寛容・攻撃的な人が多いのはなんでなんだろうねぇ?
mohtaの呪い?
- 285 :デフォルトの名無しさん:2016/07/07(木) 02:40:42.16 ID:p2jZ7JSr.net
- たまにはEBSDICの事も思い出してあげてください
- 286 :デフォルトの名無しさん:2016/07/07(木) 04:21:45.52 ID:iN/cSWGV.net
- ヱビス?
- 287 :デフォルトの名無しさん:2016/07/07(木) 07:50:53.33 ID:zLr8XHI6.net
- >285
エビスでなく、
EBCDIC
- 288 :デフォルトの名無しさん:2016/07/07(木) 08:09:28.67 ID:Xq4hCxWT.net
- 攻撃的はそうだけど、不寛容な人はあまり見かけないな。
それから、出所不明の誤ったことを自信満々に広めようとする人は多い。
- 289 :デフォルトの名無しさん:2016/07/07(木) 11:28:32.01 ID:77RIzO9k.net
- >>284
半角カナ気違いのトラウマだろうね
- 290 :デフォルトの名無しさん:2016/07/07(木) 23:08:15.02 ID:Fnd7xREL.net
- 昔、カナ漢字変換の機能が貧弱だった頃、第2水準漢字のほとんどは
コード直接入力じゃないと出せなかったらしい。
その時代を知っているジジババはむしろ若者よりもコードの知識があるかも。
- 291 :デフォルトの名無しさん:2016/07/08(金) 00:08:00.05 ID:oeqNGrjL.net
- >>290
その時代にワープロを使っている人間が少なすぎる。
- 292 :デフォルトの名無しさん:2016/07/08(金) 09:37:59.75 ID:RQ/bQ+xA.net
- いまでも第2水準の読めないような漢字が出ないのは一緒では。特にスマホとかでは
- 293 :デフォルトの名無しさん:2016/07/08(金) 12:53:57.37 ID:+iCwFkYB.net
- Windowsはいい加減にCP932やめればいいのに
- 294 :デフォルトの名無しさん:2016/07/08(金) 13:56:23.18 ID:SPYn5bNr.net
- >>290
JIS区点コードな
さすがにいわゆるSJIS系の2バイト文字の話とか
UCS4とかUTF-8とかは通じないだろ
- 295 :デフォルトの名無しさん:2016/07/08(金) 14:04:01.86 ID:FG8sQouZ.net
- >>278
歴史的説明ならともかく今時6バイトって
- 296 :デフォルトの名無しさん:2016/07/08(金) 23:17:05.68 ID:5kBVrybZ.net
- 小学生向け漢字辞典にも文字コードが載っているのが唯一ある。三省堂のやつ。
しかしこれがJIS句点コードだけなのだ。こんな所にもJIS信者の陰謀が。
- 297 :デフォルトの名無しさん:2016/07/09(土) 05:34:05.37 ID:/Jgzrjn9.net
- ふむ
- 298 :デフォルトの名無しさん:2016/07/09(土) 16:20:52.60 ID:ZRZgi1xJ.net
- 三省堂は安岡センセイの牙城だからな
http://dictionary.sanseido-publ.co.jp/wp/author/yasuoka/
- 299 :デフォルトの名無しさん:2016/07/09(土) 16:24:06.20 ID:chKLWi+d.net
- やっぱり三省堂がナンバーワン!
- 300 :デフォルトの名無しさん:2016/07/09(土) 18:40:43.19 ID:J471aLuE.net
- >>296
>句点コード
反省汁
- 301 :デフォルトの名無しさん:2016/07/09(土) 20:53:51.60 ID:9etHa3qY.net
- >>300
何をする事がある
- 302 :デフォルトの名無しさん:2016/07/09(土) 23:31:07.38 ID:XNO4Gui5.net
- >>300 スマンカッタ
句点と読点のそれぞれのJIS区点コードは……ってそういう話じゃないよね。
今時のオフィスでは漢字をコードで言い表さなくても、メール送って、
この字をコピペしろ、で話が済む。たいていの場合。
だがメールが使えないオフィスが存在するのだ。
ウィルス感染が怖い、個人情報の漏洩が怖い、と言ってごく一部以外のPCは
インターネットに繋がっていない。LANにすら繋がっていない。
穴だらけのXPを全くアップデートせずに使い続けている。
文字コードの知識云々以前にこっちの方が問題かも。
- 303 :デフォルトの名無しさん:2016/07/10(日) 00:58:49.17 ID:MJNrlAwo.net
- 十進法で1オリジンだから
十六進法で0オリジンが一般的なプログラミングの世界に持ってく時ちょっと戸惑う>区点コード
- 304 :デフォルトの名無しさん:2016/07/10(日) 01:18:18.40 ID:D0PozWsA.net
- 最初から JIS X 0208 で考えていれば違和感は無い。
- 305 :デフォルトの名無しさん:2016/07/10(日) 02:25:10.70 ID:MUn32aUj.net
- 𩿎 この字をコピペしろ
で話が済まないこともあるから2面94区5点と書いてある方が親切なこともある
- 306 :名無しさん@そうだ選挙に行こう! Go to vote!:2016/07/10(日) 19:18:33.41 ID:Xe3UNHu3.net
- パートのおばちゃんが「この字が出せない」と言っていたので、コードを調べて直接入力の方法を教えた。
そしたら、「そんな難しい方法じゃないと出ない字は出しません」と拒否。
管理職もそれでいいと思っている。
- 307 :名無しさん@そうだ選挙に行こう! Go to vote!:2016/07/10(日) 19:28:45.85 ID:Xe3UNHu3.net
- ヒロユキのヒロは康煕字典の煕、ユキは王羲之の之、これで話が通じれは
コードの知識がなくても何とかなる。けどそういう言い方は全く通じない職場がある。
で、バカみたいにA4の紙にでかい字で「煕之」と書いてFAXで送っている。
時間と紙と通信料金の無駄。
- 308 :デフォルトの名無しさん:2016/07/10(日) 20:25:26.13 ID:Vv5iaDQO.net
- >ヒロユキのヒロは康煕字典の煕、ユキは王羲之の之、これで話が通じれは
それで通じる職場ってすごくピンポイントなんじゃないか
- 309 :デフォルトの名無しさん:2016/07/10(日) 23:34:57.25 ID:Xe3UNHu3.net
- >>308
字の間違いが決して許されない職場では自然にそうなりそうな気もするんだが。
だいたい職場に大漢和辞典も康煕字典も無いとはもう駄目だ。
鼎という字を「何か県に似ている難しい字」などと言っている。u+9F0Eとは決して言わない。
高校時代に漢文が苦手だった俺だって「鼎の軽重を問う」という故事ぐらい知っている。
高卒以下か。
- 310 :デフォルトの名無しさん:2016/07/11(月) 00:15:55.13 ID:Oq6wujXh.net
- >>290
漢ROMには第一水準しか乗ってなかった
- 311 :デフォルトの名無しさん:2016/07/11(月) 00:42:20.21 ID:TRcfwTqd.net
- u+9F0Eとは決して言わない。いや言わんだろw
- 312 :デフォルトの名無しさん:2016/07/11(月) 02:04:05.71 ID:Y4y2Cs39.net
- PC-9801初代とかE、F、Mの頃だな
- 313 :デフォルトの名無しさん:2016/07/11(月) 02:09:47.93 ID:Y4y2Cs39.net
- いや初代はJIS第1水準ROMも別売オプションだったか
- 314 :デフォルトの名無しさん:2016/07/11(月) 04:11:38.97 ID:1UixPK66.net
- そういう環境は区点でも出ないから今は話題にしてない
- 315 :デフォルトの名無しさん:2016/07/11(月) 04:53:41.27 ID:heaUdTdc.net
- 鼎立(ていりつ)
- 316 :デフォルトの名無しさん:2016/07/11(月) 14:01:39.24 ID:d9uyyk2v.net
- >>283
たしかに合ってる
http://www.ndl.go.jp/jp/data/bib_newsletter/2016_1/article_06.html
- 317 :デフォルトの名無しさん:2016/07/11(月) 14:48:05.83 ID:czE7oCdB.net
- > しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイト(31ビット)でエンコードする
> サロゲート・ペアと呼ばれる方法が考え出されました。このエンコード法をUTF-16(16-bit UCS Transformation Format)と呼びます。
まるでUTF-8を拡張したらUTF-16が生まれたみたいな書きっぷりなんだが。。。
- 318 :デフォルトの名無しさん:2016/07/11(月) 19:26:42.34 ID:zdvynnCD.net
- dmcがL"\uXXXX"で5桁以上に対応してなかったでござるよ
- 319 :デフォルトの名無しさん:2016/07/11(月) 23:35:12.52 ID:O+Gjjko5.net
- あーあサイト閉鎖
http://www.asahi-net.or.jp/~ax2s-kmtn/
- 320 :デフォルトの名無しさん:2016/07/12(火) 12:50:10.21 ID:Z7lOs0LB.net
- サイト閉鎖させるとか文字コード関係者は傲慢
- 321 :デフォルトの名無しさん:2016/07/12(火) 14:22:38.54 ID:jKILz9qy.net
- そもそも不正確だろうが整合性なかろうが
その旨明記しておけば問題ないのに
断定しちゃうからダメなんだよなぁ
自分用のメモとしても訳に立たんだろうに
- 322 :デフォルトの名無しさん:2016/07/12(火) 16:29:11.31 ID:/KovKhYj.net
- >>319
知らないなら解説しないでくださいうざいだけです
- 323 :デフォルトの名無しさん:2016/07/12(火) 16:34:35.95 ID:/KovKhYj.net
- >>278
>【Unicodeのエンコーディング】※この章の内容を修正しました(2016年7月8日)
治ってたはω
- 324 :デフォルトの名無しさん:2016/07/12(火) 22:47:59.76 ID:iIVSUpVx.net
- >>316のレターの著者=>>319のサイトの作者
なの?
Cyber Librarianなら見たことあるけどサイトを見た限りでは
そんな脇の甘いっつーか、ツッコミどころ満載の文章書く人には思えなかったが。
- 325 :デフォルトの名無しさん:2016/07/13(水) 00:43:08.39 ID:SuD222os.net
- https://web.archive.org/web/20160331090356/http://www.asahi-net.or.jp/~ax2s-kmtn/character/uni.html
まあ同一人物でなければ盗用だろうなってかんじ
- 326 :デフォルトの名無しさん:2016/07/13(水) 01:00:57.82 ID:elchF/Ne.net
- 普通に考えたら同一人物だろ
上綱 秀治(かみつな しゅうじ) ⇒ s-kmtn
- 327 :デフォルトの名無しさん:2016/07/13(水) 02:15:04.74 ID:fhWupBlz.net
- くみたんじゃないのか。
- 328 :デフォルトの名無しさん:2016/07/13(水) 04:46:49.29 ID:QAw5IbxT.net
- >>325
同一人物だね
http://web.archive.org/web/20160501170424/http://www.asahi-net.or.jp/~ax2s-kmtn/profile.html
- 329 :デフォルトの名無しさん:2016/07/13(水) 09:20:59.26 ID:6cXc/1BZ.net
- >>325
>UTF-8は、ASCIIコードに当たる部分はASCIIコードと同じコードで
>1バイトで表し、それ以外の文字を2〜6バイトの可変長で表します。
>しかし、UTF-8ではUCS-2の範囲の文字しか扱えません。
>そこで、UCS-2の範囲は2バイト、UCS-4の範囲は4バイトでエンコードする
>サロゲート・ペア(Surrogate Pair)と呼ばれる方法が考え出されました。
自分で書いた嘘を自分で信じ込んでしまったのか
- 330 :デフォルトの名無しさん:2016/07/13(水) 13:48:05.15 ID:5kGFdS9R.net
- >>325
あー、これは(アカン)
- 331 :デフォルトの名無しさん:2016/07/13(水) 17:23:44.93 ID:Zm0ukFfg.net
- >>322
>>319 は解脱したんだ
- 332 :デフォルトの名無しさん:2016/07/13(水) 17:25:59.10 ID:Zm0ukFfg.net
- >>325
おわってんな
- 333 :デフォルトの名無しさん:2016/07/13(水) 21:14:40.56 ID:hX7/yWDM.net
- くみたん大人気
- 334 :デフォルトの名無しさん:2016/07/13(水) 23:46:02.63 ID:g/v1wH4T.net
- >>305
そうやって親切に説明しても理解しようとしない奴が多い。
自分の努力不足を棚に上げて。
新聞紙屋にも市役所職員にもそういう説明は通じなかった。
- 335 :デフォルトの名無しさん:2016/07/13(水) 23:58:49.98 ID:r/tNmXJO.net
- 天皇陛下が生前退位を望んでおられるらしいが
年号が変わったらまた組み文字のがUnicodeに登録されるんだろうか。
そしてNEC特殊文字の空き区点位置にも追加されたりするんだろうか?
- 336 :デフォルトの名無しさん:2016/07/14(木) 14:43:57.97 ID:QNDyLPqn.net
- >>334
文系のばかに多いよなそういうの
- 337 :デフォルトの名無しさん:2016/07/14(木) 15:27:07.43 ID:9OuGPMv3.net
- ~順紫
- 338 :デフォルトの名無しさん:2016/07/14(木) 17:50:45.39 ID:/KqsG61x.net
- >>335
Unicode側が先に動くんじゃなくて国内規格が変わったら重い腰を上げる感じじゃね?
JIS X 0213に追加されたら多分入れざるを得ないだろう。
- 339 :デフォルトの名無しさん:2016/07/14(木) 18:58:13.31 ID:FxiZTBVJ.net
- Unicodeの組み文字はやたら多いんだよなあ
これ以上増やさないでいいと思うが
ARIBあたりは収録しそうだ
- 340 :デフォルトの名無しさん:2016/07/14(木) 19:04:28.88 ID:QNDyLPqn.net
- そもそもどんな元号になるか機械学習で予想汁
- 341 :デフォルトの名無しさん:2016/07/15(金) 17:59:32.47 ID:UYk8auDK.net
- 元号変わったら組み文字がJISやUnicodeに追加されるだろうか。
あれらはあくまで使用非推奨の互換用だけど平成迄あるのに
〇〇(新元号)は無いのはおかしいって文句言う人いそうだし。
そしてUnicodeに追加されるならBMP外になるのかな。
- 342 :デフォルトの名無しさん:2016/07/15(金) 18:35:42.95 ID:VjVb35Nf.net
- JISは確実じゃろう
- 343 :デフォルトの名無しさん:2016/07/15(金) 19:47:06.41 ID:hA/ek+uV.net
- 天皇陛下はさまざまな影響を考えて、数年後とおっしゃっている。
- 344 :デフォルトの名無しさん:2016/07/15(金) 21:22:13.08 ID:6VjYEGCM.net
- 天皇陛下はさまざまな影響を考えて、(Unicodeへの追加は)数年後とおっしゃっている。
かと思った
- 345 :デフォルトの名無しさん:2016/07/15(金) 23:56:20.80 ID:sNlxveIP.net
- 明治〜平成がBMPなのに新元号がSMPなのは納得いかないって人出てくるだろう。
でもU+33xxのBMPのCJK互換文字領域は空いてない。
U+32xxの囲み文字等の領域だったら
U+32FFが空いてるけどそこは○ンの為にとっておくべきって理由で却下かも。
(ARIB外字の□デは当初そこで提案されてたがSMPに移された。)
U+321Fも空いてるけどそこはハングルの為に予約でダメかな。
2文字合わせて1字の漢字扱いでCJK統合漢字無印の末端部分に追加とかするかも。
- 346 :デフォルトの名無しさん:2016/07/16(土) 00:01:26.24 ID:5z5Xjrfb.net
- >>344
陛下はIT業界のことまで考えてくださっているんだぞ。
- 347 :デフォルトの名無しさん:2016/07/16(土) 00:14:15.53 ID:32MvK4yp.net
- >>345
>2文字合わせて1字の漢字扱い
面白いけど縦書きしたときに組み変わる漢字ってありなのかなあ…
- 348 :デフォルトの名無しさん:2016/07/16(土) 00:24:24.28 ID:gxGUgS9b.net
- 明治を廃止して新元号をそこに追加
- 349 :デフォルトの名無しさん:2016/07/16(土) 01:19:59.61 ID:cSN7L73p.net
- ケチ臭いこと言わず大化から全部実現できるよう結合文字でやれ
- 350 :デフォルトの名無しさん:2016/07/16(土) 02:08:19.62 ID:nOt6AvP3.net
- >>348
それはない
- 351 :デフォルトの名無しさん:2016/07/16(土) 02:30:42.97 ID:lwkaPYM/.net
- 書類上は明治生まれもまだいっぱい生き残って年金もらってるんだろう?
- 352 :デフォルトの名無しさん:2016/07/16(土) 06:16:44.45 ID:G3ZPSnBi.net
- 明治生まれって105歳くらいでそろそろ長寿ギネスを争う位置やで
ゴーストは知らんけど例の事件以降対策は取ってるはず
- 353 :デフォルトの名無しさん:2016/07/16(土) 14:40:44.25 ID:9Y22Kipm.net
- >>335
生前退位は間違い
正しくは譲位
- 354 :デフォルトの名無しさん:2016/07/16(土) 14:43:32.66 ID:9Y22Kipm.net
- >>349
それな+1
- 355 :デフォルトの名無しさん:2016/07/16(土) 17:16:57.05 ID:q/+YlM5I.net
- >>353
譲位もいまの日本の法律では規定されていない言葉。
- 356 :デフォルトの名無しさん:2016/07/16(土) 20:48:48.31 ID:lwkaPYM/.net
- 譲位だと本人の意思が入るから、憲法との関係上無理だろうな。
- 357 :デフォルトの名無しさん:2016/07/16(土) 22:09:26.27 ID:ngMcbYeI.net
- 間を取って、新元号を「譲位」にするのだ。
- 358 :デフォルトの名無しさん:2016/07/16(土) 23:20:32.22 ID:DxYW1o4r.net
- Macの機種依存文字でUnicodeにない組み文字とかは
PUAのうち何個かのコードポイントを後続の複数文字を組み文字とみなすとかの制御文字にして
変換時はそれらを使ったシーケンスにしてるけど
それらを正式なUnicodeポイントに追加すればいいんじゃないかな。
BMPの末端部の特殊用途文字の領域空いてるよな。多くなったら14面使えばいいし。
- 359 :デフォルトの名無しさん:2016/07/17(日) 07:52:07.09 ID:x5VmunYw.net
- ゼロレングス結合何とかでいいだろ
年号
- 360 :デフォルトの名無しさん:2016/07/17(日) 11:40:00.96 ID:4VxhtWVI.net
- [組文字2字] ○ × みたいな組み合わせで組文字を出せれば、どんな元号だろうと対処できるんじゃね?
- 361 :デフォルトの名無しさん:2016/07/17(日) 12:03:06.58 ID:OJhNugRE.net
- 立ちふさがる神護景雲
- 362 :デフォルトの名無しさん:2016/07/17(日) 19:57:53.09 ID:SZ0VR+WQ.net
- 絵文字だと4人くっつけて家族にしてるから余裕だろ
- 363 :デフォルトの名無しさん:2016/07/18(月) 13:08:10.78 ID:DeXLreOM.net
- 天平hogehogeも忘れないであげて
- 364 :デフォルトの名無しさん:2016/07/18(月) 14:35:50.20 ID:xsPahNIS.net
- Unicode Consortium、人物を示す絵文字の大半で男女の切り替えを可能にする計画
http://it.srad.jp/story/16/07/17/1824252/
- 365 :デフォルトの名無しさん:2016/07/18(月) 18:20:37.53 ID:Al5nS1HD.net
- いらん
- 366 :デフォルトの名無しさん:2016/07/18(月) 20:01:39.34 ID:V8MPLMCF.net
- 男のプリンセス👸みたいな
- 367 :デフォルトの名無しさん:2016/07/18(月) 20:49:35.27 ID:nMdxdQ2m.net
- 結局タグ文字は止めてZWJでくっつけることにしたのか
まあ俺は要らんけど、Googleはやるんだろうな。
- 368 :デフォルトの名無しさん:2016/07/19(火) 01:10:44.77 ID:OzJr/LCv.net
- うんこと炎をくっつけて焼きカレー
- 369 :デフォルトの名無しさん:2016/07/20(水) 00:14:41.29 ID:c9Lgaa22.net
- 俺なんでこんなの書いたんだろ
- 370 :デフォルトの名無しさん:2016/07/20(水) 16:25:57.26 ID:uqKREUqt.net
- 元号の組み文字も平成の次からは
(1文字目) ZWJ (2文字目)
でいいだろう。元号に限らず他の組み文字もこのようなやり方で。
- 371 :デフォルトの名無しさん:2016/07/21(木) 22:48:02.74 ID:9yJr9MXg.net
- L2/16-188 Revised Proposal of Hentaigana (with associated spreadsheet) Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16188-rev-hentaigana-rep.pdf
L2/16-189 Proposal to add a new character name alias to U+1B001 Japan N.B. 2016-07-15
http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf
久しぶりに日本の提案書が来てた。
- 372 :デフォルトの名無しさん:2016/07/22(金) 00:45:15.53 ID:9PI3Dwz3.net
- HENTAIYAGANA!
同じ音価のやつどう名前つけるのかと思ってたら単純に番号振ったんか。
しっかしほぼ同じじゃないかってやつがいくつもあるな…
- 373 :デフォルトの名無しさん:2016/07/22(金) 15:36:11.58 ID:mXdhJl5k.net
- >http://www.unicode.org/L2/L2016/16189-n4731-alias-to-1B001.pdf
>※ HENTAIGANA LETTER E-1
当然のように「※」を使っちゃうあたり紛れもなくわが国のNBだな
- 374 :デフォルトの名無しさん:2016/07/22(金) 18:46:03.53 ID:30Ur4lVX.net
- 海外でHENTAIって言ったらエロ漫画のことなんだろ?
- 375 :デフォルトの名無しさん:2016/07/22(金) 23:40:37.75 ID:ftmyXYU2.net
- 変態がな(´・ω・`)
- 376 :デフォルトの名無しさん:2016/07/23(土) 19:23:17.75 ID:23ptH+Cg.net
- HENTAIGANAじゃなくてARCHAIC KANAにした方がいいかな。
- 377 :デフォルトの名無しさん:2016/07/23(土) 22:48:56.85 ID:9DZF6Yvk.net
- 376ができるならそうしてほしい
- 378 :237:2016/07/24(日) 13:36:56.67 ID:6r1nbUWl.net
- Wikipediaにも別称として載ってるitaiganaならまだしも、一般的でない訳語を増やすのはやめてくれ
- 379 :デフォルトの名無しさん:2016/07/24(日) 13:38:46.61 ID:wdZTIji9.net
- しらんがなも追加で
- 380 :デフォルトの名無しさん:2016/07/24(日) 14:21:52.39 ID:KetOMPlM.net
- 痛い(>_<)がな
- 381 :デフォルトの名無しさん:2016/07/24(日) 18:14:24.67 ID:jDvbVIvk.net
- しらんがな-1
しらんがな-2
しらんがな-3
どうでもいいレベルに応じて数字が上がっていくしらんがな
- 382 :デフォルトの名無しさん:2016/07/25(月) 03:34:48.68 ID:+HnBvISv.net
- しらんがな(´・ω・`)
- 383 :デフォルトの名無しさん:2016/07/27(水) 23:58:18.41 ID:LlxcxPCX.net
- 漢字なんかもUnicodeではCJK Ideograph(日中韓の表意文字)という独特な表現なんだよな。
通常はChinese character(中国の文字)とか日本で使われるもの限定ならKanjiとかだけど、
中国語だけでなく日本語でも必要不可欠なことから中立的な観点でそうしたのかな。
- 384 :デフォルトの名無しさん:2016/07/28(木) 00:49:49.72 ID:5nmTx3N/.net
- >>383
それUTF-16だろ。
- 385 :デフォルトの名無しさん:2016/07/28(木) 01:46:29.52 ID:0eJShhc0.net
- ぇ?
- 386 :デフォルトの名無しさん:2016/07/28(木) 03:14:54.78 ID:V4Cbn7HZ.net
- え?
- 387 :デフォルトの名無しさん:2016/07/28(木) 06:15:57.66 ID:A01hQQOB.net
- ゑ?
- 388 :デフォルトの名無しさん:2016/07/28(木) 07:33:28.43 ID:Gt2rQ6iY.net
- >>383
「漢字って言語圏ごとに登録したらとんでもない量になる。出自は同じだし統合すっか」
っていう混ぜ書き全否定な仕様にしたからな
統合したんだからKanjiっていう日本語読みじゃなくて「極東の表意文字」みたいな名前つけられるのは当然の成り行き
- 389 :デフォルトの名無しさん:2016/07/28(木) 08:14:34.00 ID:tnN3Zull.net
- UCDのファイル名はUnihan(Unified-HAN)だろ
つまり韓国が起源
- 390 :デフォルトの名無しさん:2016/07/28(木) 09:47:39.76 ID:V0F605Q9.net
- 繁字体の繁
- 391 :デフォルトの名無しさん:2016/07/28(木) 10:28:08.04 ID:49cPLP5e.net
- そうはいっても迷惑かけている部分もあるからな
英語だったら高々数十個のアルファベットと幾つかの記号だけで済むところを
何万種類も必要になる方が悪いだろ、どう考えても
- 392 :デフォルトの名無しさん:2016/07/28(木) 10:52:38.11 ID:765MMEfE.net
- >どう考えても
何をどう考えたらそんなキチガイの発想に至ったのか
- 393 :デフォルトの名無しさん:2016/07/28(木) 13:16:07.78 ID:V4Cbn7HZ.net
- 英国はアヘン戦争で清を滅亡させるべきだったし、
米国は太平洋戦争で日本を滅亡させるべきだったね。
- 394 :デフォルトの名無しさん:2016/07/28(木) 13:20:15.08 ID:xeepOtn0.net
- 幽霊文字が規格化される国だから反論できない
- 395 :デフォルトの名無しさん:2016/07/28(木) 14:16:22.55 ID:ZhRv9dtO.net
- 勝手に新しい絵文字作り出してる現状なんだし気にするな
と思ったけど文字が少ない文化圏の連中はその反動なのかもしれないな
- 396 :デフォルトの名無しさん:2016/07/28(木) 19:12:45.37 ID:O8Vfrh0P.net
- 将来再び毛沢東みたいなアホが出てきて新文字増やす可能性もないとはいえない
- 397 :デフォルトの名無しさん:2016/07/28(木) 23:10:34.74 ID:+NfDBjt/.net
- >>388
でも統合しきれなくてコードポイントを無駄遣いしているのが多数。
例えば一例として説と說が別字扱いというのは納得できない。
康煕字典に47000字、大漢和辞典に50000字というのは調べれば最初から分かった筈。
相当節約すべきなのにそれを怠ったから16bitのバベルの塔は頓挫した。
>>394
そしてそれを廃止できない。負の文化遺産として今後も残るだろう。
- 398 :デフォルトの名無しさん:2016/07/28(木) 23:49:12.01 ID:m+0rYuPE.net
- そういえばニホニウムの中国語表記はどうなるんだろう
- 399 :デフォルトの名無しさん:2016/07/29(金) 01:02:54.07 ID:SETcyGJa.net
- 小日本素あたり?
- 400 :デフォルトの名無しさん:2016/07/29(金) 07:36:19.19 ID:Lct7OLsq.net
- え?
- 401 :デフォルトの名無しさん:2016/07/29(金) 08:13:31.17 ID:GYJuIIBJ.net
- >>397
>説と說が別字扱いというのは納得できない
自国の文化以外を受け入れることが出来ない奴は吠えてろ。
アメリカ人が英語圏以外のことを軽視してるのと同様に
お前のその思想が世界に迷惑
- 402 :デフォルトの名無しさん:2016/07/29(金) 12:00:07.20 ID:5X3dVFw4.net
- 原規格分離規則が無かったら更にカオスなことになってそう
- 403 :デフォルトの名無しさん:2016/07/29(金) 23:13:14.93 ID:qPs+aDEn.net
- >>401
それは逆。
漢字文化を理解しない西洋人が規格化したからそうなってしまった。
康煕字典の「正字」がどのような経緯で成立したかほんの少し勉強すれば、それらが同字だと理解できる。
ついでに日本のバカな国語審議会がどんなふうにバカな国語国字改革を行ったかも知っておくべき。
- 404 :デフォルトの名無しさん:2016/07/30(土) 00:36:36.04 ID:GBcwIM/b.net
- 説と說の違いなどフォントの違いに過ぎない。
これを別字だと主張するのはGaramondのAとBodoniのAは別字だと主張する様なものだ。
- 405 :デフォルトの名無しさん:2016/07/30(土) 01:00:50.77 ID:nwxv/kKT.net
- IPAを食らうがよい
- 406 :デフォルトの名無しさん:2016/07/30(土) 02:27:38.51 ID:VkFDbK5O.net
- フォントの違い?じゃあ別字で😁
A A 𐌀 𝐀 𝐴 𝑨 𝒜 𝓐 𝔄 𝔸 𝕬 𝖠 𝗔 𝘈 𝘼 𝙰
- 407 :デフォルトの名無しさん:2016/07/30(土) 03:37:32.39 ID:crIAC8Sk.net
- BOMを食らうが良い。
- 408 :デフォルトの名無しさん:2016/07/30(土) 05:58:51.63 ID:7lrNNE5f.net
- >>403を通訳すると
「現規格分離などどうでもいい」
「日本の漢字文化がすべて。他の国のことは知らん」
最悪だな
- 409 :デフォルトの名無しさん:2016/07/30(土) 06:32:16.51 ID:RG1Ilx1/.net
- × 現規格
○ 原規格
- 410 :デフォルトの名無しさん:2016/07/30(土) 13:16:26.02 ID:NnN7Vre0.net
- >>404
華と华は同じ字ですか?
- 411 :デフォルトの名無しさん:2016/07/30(土) 13:17:35.16 ID:NnN7Vre0.net
- >>406
Уとyは同じ字ですか?
- 412 :デフォルトの名無しさん:2016/07/30(土) 21:48:28.00 ID:dIHoRAg/.net
- ソ
ン
ツ
シ
カタカナのヘ
ひらがなのへ
- 413 :デフォルトの名無しさん:2016/07/30(土) 21:55:31.23 ID:cBq8SpsU.net
- :::::::::::/ ヽ::::::::::::
:::::::::::| ば じ き i::::::::::::
:::::::::::.ゝ か つ み ノ:::::::::::
:::::::::::/ だ に は イ:::::::::::::
::::: | な。 ゙i ::::::
\_ ,,-'
――--、..,ヽ__ _,,-''
:::::::,-‐、,‐、ヽ. )ノ _,,...-
:::::_|/ 。|。ヽ|-i、 ∠_:::::::::
/. ` ' ● ' ニ 、 ,-、ヽ|:::::::::
ニ __l___ノ |・ | |, -、::
/ ̄ _ | i ゚r ー' 6 |::
|( ̄`' )/ / ,.. i '-
`ー---―' / '(__ ) ヽ 、 >>1
====( i)==::::/ ,/ニニニ
:/ ヽ:::i /;;;;;;;;;;;;;;;;
- 414 :デフォルトの名無しさん:2016/08/01(月) 17:17:15.79 ID:JXVULl1x.net
- ソとンは微妙なのは判るが
ツとシは明らかに違う字だろ
- 415 :デフォルトの名無しさん:2016/08/01(月) 17:43:19.40 ID:A0XjWkqP.net
- ( ツ )ノシ
- 416 :デフォルトの名無しさん:2016/08/01(月) 22:12:49.95 ID:AzMK4PQ3.net
- 兌を部品として含む字は説の他にも色々ある。
脱 税 悦 など。これらは統合されている。
説は何故か康煕字典の正字(Big5,KS)と楷書通用字体(JIS,GB)の2種類に分裂している。
固有名詞の表記で揉め事になる字でもない。何かの手違いかと。
>>414
日本人にとっては明らかに違う字だが中国人、韓国人などには区別しづらいようだ。
アジアからの輸入品ではそういう誤植はよく見かける。ショートカット→ツョートカシト など。
レ、し の混同も多い。
- 417 :デフォルトの名無しさん:2016/08/01(月) 22:24:15.16 ID:AzMK4PQ3.net
- 日本人にとってシンデレラとツンデレラは明らかに違う。外国人に(ry
- 418 :デフォルトの名無しさん:2016/08/01(月) 23:10:29.38 ID:AzMK4PQ3.net
- 説と说はunicodeでは別字だった。
という事で訂正。JISは楷書通用字体、GBは簡体字。つまり3種類に分裂している。
スマンカッタ。
- 419 :デフォルトの名無しさん:2016/08/02(火) 02:07:22.57 ID:1KCZrKLH.net
- >>418を通訳すると
「原規格分離などどうでもいい」
Windowsコードページ936(GBK)より
U+8AAC(説) = D568
U+8AAA(說) = D566
U+8BF4(说) = CBB5
- 420 :デフォルトの名無しさん:2016/08/02(火) 14:41:15.32 ID:X69kNOq3.net
- 誰得…
https://twitter.com/Emojipedia/status/760240063397654528
- 421 :デフォルトの名無しさん:2016/08/02(火) 19:31:05.47 ID:JwtZ9iAm.net
- >>416
>ショートカット→ツョートカシト
日本人にもいるわ
- 422 :デフォルトの名無しさん:2016/08/02(火) 20:49:40.10 ID:LBy6cWLg.net
- こうやって、タンクトップにショートパンツを貼り付けるんだお。
意味:デスクトップにショートカットを貼り付ける。
- 423 :デフォルトの名無しさん:2016/08/02(火) 23:35:51.72 ID:zi+BVpwh.net
- ディスクトップのことをタンクトップというやつは見たことないな
- 424 :デフォルトの名無しさん:2016/08/02(火) 23:48:20.71 ID:2l83Zpm1.net
- 円盤の上に
- 425 :デフォルトの名無しさん:2016/08/03(水) 00:17:44.35 ID:4zWXrFMO.net
- >>398-399
中国人は元素記号を漢字1文字で表す。こんな具合。
ttp://www.akatsukinishisu.net/kanji/genso/UTF-8.html
>>419
GBKはUnicode1.1より後に出来た。何故かUnicodeの駄目な部分をかなり含んでいる。
それを引き合いに出すのは筋違いとまでは言わなくても、慎重に考える方が良いかと。
- 426 :デフォルトの名無しさん:2016/08/03(水) 17:17:04.74 ID:XuAWxec+.net
- iOS 10では拳銃の絵文字が水鉄砲の絵文字に置き換えられる | スラド アップル
http://apple.srad.jp/story/16/08/03/0444222/
- 427 :デフォルトの名無しさん:2016/08/03(水) 18:29:34.34 ID:mbys/AN5.net
- わろた
- 428 :デフォルトの名無しさん:2016/08/03(水) 18:31:08.54 ID:mbys/AN5.net
- Aが牛刀かなんかで
JがJナイフだろ
- 429 :デフォルトの名無しさん:2016/08/03(水) 23:47:05.83 ID:4zWXrFMO.net
- 森鴎外と書こうと森鷗外と書こうとどちらでも良い、というのが一般人の感覚。
これはそれほど不健全とは思えない。何しろ自筆原稿に「森鴎外」と書かれているんだから。
鴎は俗字だケシカラン、というのは一部の規範意識の強い正字正かな主義のキチガイ。
鷗はダメだ鴎と書け、というのはもっと訳のわからん国語改革主義のキチガイ。
こいつらがJISの83改定を行った為にカオスに。
- 430 :デフォルトの名無しさん:2016/08/04(木) 08:56:22.25 ID:FjB5rL2o.net
- >>429
使いわけがされていない字体違いの漢字はまとめてしまおうというのは文字コードの問題ではない。
- 431 :デフォルトの名無しさん:2016/08/04(木) 12:12:59.75 ID:8anV95gh.net
- 恵'
っていうのも流行ったけど
文字コードありますか?
- 432 :デフォルトの名無しさん:2016/08/04(木) 17:09:02.57 ID:TBSxpqkz.net
- U+6075 U+E101
- 433 :デフォルトの名無しさん:2016/08/04(木) 18:54:49.83 ID:GAy76/a3.net
- U+FA6B
U+6075 U+E103
でもいいのよ?
- 434 :デフォルトの名無しさん:2016/08/04(木) 19:07:39.26 ID:8anV95gh.net
- U+FA6B でいけましたありがとう
- 435 :デフォルトの名無しさん:2016/08/04(木) 19:32:46.16 ID:Ki4RLkNz.net
- U+6075 U+FE00
でもいいぞ
- 436 :デフォルトの名無しさん:2016/08/05(金) 14:48:07.96 ID:nIRHSvG0.net
- この流れ、前にどこかで読んだ気がするなー、と思ったら
直井氏の「重複符号化四天王」だった。↓
ttp://d.hatena.ne.jp/NAOI/20130116/1358319668
- 437 :デフォルトの名無しさん:2016/08/05(金) 14:56:27.37 ID:9LvdmO9z.net
- ということは祇園もあれか
祗園と書くとやられるのか
- 438 :デフォルトの名無しさん:2016/08/05(金) 14:58:22.57 ID:LJe/qM3f.net
- julia> '\ufa6b'
'恵'
さすがだな
- 439 :デフォルトの名無しさん:2016/08/05(金) 22:00:51.73 ID:49rJvUnO.net
- >>436
最近更新されてないな
- 440 :デフォルトの名無しさん:2016/08/05(金) 22:19:20.77 ID:zXAznUbh.net
- >>430
いや、全く無関係ではあるまい。
鴎と鷗は使い分けがされていなかった、という点ではあなたも同意してくれるだろう。
原規格分離されていないのにUnicodeでは別字扱いになってしまった。
そもそも83改定を行ったJISと唆した国語審議会に元凶があったのだが、Unicodeにも責任の一端がある。
国語審議会は鷗を滅ぼして鴎に置き換えようとした。
本人に問い詰めて確認したわけではないが、多分そういう事だろう。
1000年以上にわたって使われ続けた字を滅ぼす事などそう簡単に出来る筈がない。
結局、国語審議会に滅ぼされる事なく生き残り、鴎と別の字になってしまった。
なお、最近見たベネッセの小学漢字辞典に鷗は載っていたが鴎は載っていなかった。
>>437
祇と祗は元々意味も読みも異なる別字。だが見た目が良く似ているので古くから混同される事が多かった。
「ぎおん」と入力して「祗園」と変換出来てしまうMS-IMEが悪い。
百歩譲ってその変換を認めるとしても、せめて「本来は誤用」ぐらいのメッセージは出してほしい。
- 441 :デフォルトの名無しさん:2016/08/05(金) 23:24:48.92 ID:Ox1rQ2Fh.net
- >>437
フォントその他がJIS X 0213:2004対応かどうかで
偏が「示」になったり「ネ」だったりには変わるな
- 442 :デフォルトの名無しさん:2016/08/06(土) 05:56:41.80 ID:g/BBNoMH.net
- もう数字の「1」も漢数字の「一」と統合しろよ。
「一回」と「1回」みたいに使い分けされてないだろ。
「ひとつ を 1つ と書くのはけしからん」なんて言う奴はキチガイ。
- 443 :デフォルトの名無しさん:2016/08/06(土) 06:01:39.31 ID:e+VUV2JF.net
- 使う漢字を減らそうとして常用漢字を策定しているのにそれが気に入らないなら義務教育を否定しろよ。
- 444 :デフォルトの名無しさん:2016/08/06(土) 06:15:36.28 ID:zLWUK7Cp.net
- >>442
1朝1夕 とか 1石2鳥 とか 8百万(やおよろず) なんて書かれたら脱力ものだけど
今じゃこんなのは当たり前なんだろうか
- 445 :デフォルトの名無しさん:2016/08/06(土) 06:22:28.56 ID:swGxqhgp.net
- つまり加藤1239段と書けと
- 446 :デフォルトの名無しさん:2016/08/06(土) 09:57:23.87 ID:G90m6v3V.net
- >>444
見たことはないが、読みがわからん奴がそのうちやるだろう。
- 447 :デフォルトの名無しさん:2016/08/06(土) 15:41:55.96 ID:lXyGJ+4s.net
- 4国地方
9州地方
- 448 :デフォルトの名無しさん:2016/08/06(土) 22:32:19.37 ID:E3d0sLCL.net
- 16進数
- 449 :デフォルトの名無しさん:2016/08/06(土) 22:35:24.25 ID:E3d0sLCL.net
- >>447
4は、ヨン、シ
よみかたがどうなるのか
時代と共によみかたもかわるそうだが、だからといって、よみかたは、どうでもいいとはいえない
辞書順にならべかえた場合、探しにくい
しじゅうきょく
しじゅうきょくもーめんと
四極子(しきょくし、英: quadrupole, quadrapole)または四重極とは、モーメントが等しい双極子
Wikipedia
- 450 :デフォルトの名無しさん:2016/08/06(土) 23:28:50.16 ID:e+VUV2JF.net
- 8日をはちにち、17日をじゅうななにちと口頭で言うなって感じだな。
特に8日と4日は聞き間違う可能性は低い。
- 451 :デフォルトの名無しさん:2016/08/07(日) 13:43:44.87 ID:sg2m+nAp.net
- もうかなり前から小学校教育では
14日はじゅうよんにちだな
- 452 :デフォルトの名無しさん:2016/08/07(日) 15:24:00.14 ID:62bJhx0K.net
- >>451
本当?
- 453 :デフォルトの名無しさん:2016/08/07(日) 16:16:16.92 ID:9cSo/AxT.net
- 三重県よんにちいち市
- 454 :デフォルトの名無しさん:2016/08/07(日) 17:19:20.29 ID:49wBLG90.net
- >>451
教員が間違っていることはよくあるんだよな。
俺も子供のころ、いろんな担任が漢字の読みを間違っていたし。
- 455 :デフォルトの名無しさん:2016/08/07(日) 23:09:39.81 ID:W0a9UwyT.net
- >>445
そんなのは異体字セレクターか何かで何とかしろ
- 456 :デフォルトの名無しさん:2016/08/07(日) 23:58:49.54 ID:13NE3PeU.net
- 絵文字のピストル、本物っぽいデザインとおもちゃっぽいデザインのどっちがいい? | スラド IT http://it.srad.jp/story/16/08/06/2215228/
- 457 :デフォルトの名無しさん:2016/08/08(月) 00:42:12.05 ID:h/269Flb.net
- 4様
- 458 :デフォルトの名無しさん:2016/08/17(水) 16:58:01.66 ID:DacIS0G0.net
- 秀丸エディタで補助漢字入りEUC-JPのデータをいじってたら何か化ける
というか秀丸がいうEUCって普通のEUC-JPじゃなくてコードページ51932(+ JIS X 0212)なのか?
- 459 :デフォルトの名無しさん:2016/08/17(水) 18:00:48.77 ID:KP9VFMD+.net
- ではまずお前の思っている「普通のEUC-JP」「51932」の定義を言ってみろ
- 460 :デフォルトの名無しさん:2016/08/17(水) 18:48:59.59 ID:DacIS0G0.net
- コードページ51932は正直よく知らないんで何ともだが
「普通のEUC-JP」はGLにASCII、GRにJIS X 0208を最初からロッキングシフトしておいて
JIS X 0212を使いたい時はSS3で一文字づつ呼び出すやつ、という説明でいいのか?
- 461 :デフォルトの名無しさん:2016/08/17(水) 19:48:09.26 ID:rsNvN518.net
- まじかよ最悪だな禿丸
でも試しに8F B2 D1を読み込ませたらX 0212の18-49が表示されたぞ
よくわからん
- 462 :デフォルトの名無しさん:2016/08/17(水) 21:43:57.03 ID:q9L8GmQf.net
- CP51932の文字セットは932そのままじゃなかったかな?丸数字とか入ってる筈。補助漢字無し
unicode?51932の変換する時中で一旦932にするので注意だったような
- 463 :デフォルトの名無しさん:2016/08/17(水) 23:42:13.69 ID:rsNvN518.net
- Windows-31JとJIS X 0212に有ってShift_JISに無い文字(例:U+9A4E)を含むUTF-32ファイルを開いてEUC-JPで保存する時だな。
UTF-32(U+9A4E)→シフトJIS IBM拡張文字(FB FB)→シフトJIS NEC選定IBM拡張文字(EE DF)→JIS(7C 61)→CP51932(FC E1)
という経路で変換するんだろうな。
>>458が期待したのは
UTF-32(U+9A4E)→(69 51)→EUC-JP(8F E9 D1)
だったと。
JIS X 0212はよく知らんが、UTF-32とのマッピング表がobsoleteなんだから禿丸の動作は仕方なくね
- 464 :デフォルトの名無しさん:2016/08/17(水) 23:54:23.01 ID:9FJ+LbN2.net
- >>461
ほとんどは正常?なんだけど、
NEC特殊文字/NEC選定IBM拡張文字/IBM拡張文字に入ってる(中でその後JIS X 0212に採録された)280文字はコードページ932の区点が優先されるっぽい?
""はJIS X 0212に従うEUC-JPなら02区81点 8F A2 F1になるはずだが秀丸のEUCでは13区66点 AD E2になってる、
"J"は76区54点 8F EC D6になるはずだが秀丸のEUCでは92区77点 FC EDになってる。
>>462
文字集合を932と同じに拡張したEUC表現ってことでいいのかですかね、ありがとう。
- 465 :デフォルトの名無しさん:2016/08/17(水) 23:58:51.50 ID:9FJ+LbN2.net
- >>463
そうそう、そういうことです!
補助漢字の前にコードページ932のNEC特殊文字/IBM拡張文字が優先なんですね……。
まあ最初からUTF-8かUTF-16にすればいいんだけど、うーん
長々とすみませんでした。
- 466 :デフォルトの名無しさん:2016/08/19(金) 02:34:45.63 ID:na9GQU+3.net
- つーかWindowsで動くエディタで、CP932互換じゃないEUC-JPに変換するのあるの?
- 467 :デフォルトの名無しさん:2016/08/19(金) 08:11:13.46 ID:R+gedXV1.net
- 932互換でも構わんがJISX0212使っといて一部はG1(X0208)とか頭おかしいだろ
シングルシフト3は無しにして別に「EUC(0212有)」みたいな文字コードを設けろって感じ
- 468 :デフォルトの名無しさん:2016/08/19(金) 13:01:11.35 ID:cXkrYKyS.net
- 文字コードは難しすぎますね
すべての文字列はUTF-32で統一されるべきでしたわ
- 469 :デフォルトの名無しさん:2016/08/19(金) 16:44:17.07 ID:MDjzAPUc.net
- >>466
「〜」でやられることは割とまじで良くあるな
- 470 :デフォルトの名無しさん:2016/08/21(日) 00:40:20.53 ID:8CSn2PR2.net
- >>460の言う普通のEUC-JPって
「~」を保存するとX0212になるんけ?
シフトジスの円マークを超える爆弾やないか
- 471 :デフォルトの名無しさん:2016/08/21(日) 01:09:58.00 ID:y7QDjexr.net
- 0212のTILDEはU+FF5Eにすればいいのでは
- 472 :デフォルトの名無しさん:2016/08/22(月) 17:49:33.33 ID:Rx9mnEUz.net
- 根拠のない俺マッピングですか
- 473 :デフォルトの名無しさん:2016/08/22(月) 19:04:01.72 ID:1uqoHG7Z.net
- >>439
Twitter に鞍替えしちゃったからなあ
- 474 :デフォルトの名無しさん:2016/08/24(水) 18:34:55.31 ID:LiadQQJo.net
- >>468
UTF-32を勉強したけど、結合シーケンスの
正規化のあたりで難しくてついていけなくなった
- 475 :デフォルトの名無しさん:2016/08/31(水) 19:23:24.63 ID:ydwY4yt1.net
- そう言えば昔、Unicodeのインディアンスレ?があったけど
スレは単発で終わったんだっけ
- 476 :デフォルトの名無しさん:2016/08/31(水) 20:38:55.78 ID:gNQCVbH8.net
- >>475
👳❔
- 477 :デフォルトの名無しさん:2016/08/31(水) 20:39:42.33 ID:gNQCVbH8.net
- (´・ω・`)
- 478 :デフォルトの名無しさん:2016/08/31(水) 21:34:59.28 ID:oHNJUglq.net
- >>476
👳❔
- 479 :デフォルトの名無しさん:2016/08/31(水) 22:07:21.28 ID:eDoof1t5.net
- インディアンの顔文字提案スレですね
- 480 :デフォルトの名無しさん:2016/08/31(水) 23:58:22.53 ID:3OVWpwKX.net
- 10人のインディアンが一人づついなくなるのか
- 481 :デフォルトの名無しさん:2016/09/01(木) 01:10:12.45 ID:lZ/6Z4Ol.net
- gとZWJで結合するのかな
- 482 :デフォルトの名無しさん:2016/09/02(金) 18:21:16.83 ID:aYJKGs1c.net
- Unicodeオワットル
- 483 :デフォルトの名無しさん:2016/09/02(金) 23:20:06.03 ID:24FH2nuP.net
- NFKD正規化って存在価値あるの?
オhルをオワットルに変換できた所で
何がうれしいのかよくわからん
- 484 :デフォルトの名無しさん:2016/09/03(土) 00:41:07.59 ID:2+PqWpLf.net
- NFKDを検索したら𝐍𝐅𝐊𝐃も𝑁𝐹𝐾𝐷もマッチする方が嬉しいし
1月が㋀にマッチしたり株式会社が㍿にマッチしたら嬉しいから
俺はメリットがあると思うけど
- 485 :デフォルトの名無しさん:2016/09/03(土) 02:21:27.68 ID:0X4SIQFT.net
- 半角ABCで検索したら全角ABCがヒットしないFirefoxさん…
- 486 :デフォルトの名無しさん:2016/09/04(日) 17:57:17.34 ID:t4IVeB0G.net
- >>483
分解除外採用すべきやろな
仕様がクソすぎる
- 487 :デフォルトの名無しさん:2016/09/04(日) 22:08:48.81 ID:I3Tx/JDs.net
- その割に何十個もあるハイフン系は
NFKDでもまとまらないという
- 488 :デフォルトの名無しさん:2016/09/05(月) 08:48:36.28 ID:uKd9K+Pl.net
- >>487
それはNFKDの仕事じゃない
- 489 :デフォルトの名無しさん:2016/09/06(火) 20:51:36.90 ID:xwAMZRD2.net
- >>488
似た文字を正規化すんのがKの正規化でしょ
実際にU+2011はNFKDでU+2010になるし
- 490 :デフォルトの名無しさん:2016/09/06(火) 21:18:50.81 ID:zD4Ev6Rw.net
- そろそろポケモン来る?
- 491 :デフォルトの名無しさん:2016/09/07(水) 01:48:06.44 ID:ebFGMU7R.net
- もう横棒類は全部 HYPHEN-MINUS に置き換えしとけ
- 492 :デフォルトの名無しさん:2016/09/07(水) 03:48:29.15 ID:lO0k6I5n.net
- >>489
compatibilityがあるものだけ
何十個もcompatibilityのあるdash/hyphenはない
横棒っぽい文字を全部集めたら数十種類あると思うが
それを全部例えばhyphen-minusに変換したら
テキストの意味が変わってしまい
到底NORMALizationと呼べるようなものではない
勿論そういう変換が有効な応用ではそうしていい
- 493 :デフォルトの名無しさん:2016/09/08(木) 20:41:13.60 ID:vRujICD+.net
- つまり「俺のcompatibility基準を満たしていないからダメだもん」
横棒類は全部 HYPHEN-MINUS に置き換えでいい
- 494 :デフォルトの名無しさん:2016/09/10(土) 02:47:21.06 ID:J+ikgNSp.net
- グダグダ言ってるとユニコード貼るぞ
俺のユニコードでお前は瞬殺
- 495 :デフォルトの名無しさん:2016/09/10(土) 12:24:25.95 ID:fOA1OM1A.net
- ユニコードは犯罪だからやめてください!
- 496 :デフォルトの名無しさん:2016/09/12(月) 10:27:24.50 ID:mOa6Tuog.net
- そこはユニコ-ドでしょ
- 497 :デフォルトの名無しさん:2016/09/12(月) 14:27:32.13 ID:gUHt3FEA.net
- >>493
unicode character databaseと言うものがありましてねえ
- 498 :デフォルトの名無しさん:2016/10/03(月) 15:40:21.15 ID:KTjG7pFJ.net
- >>497
で?
- 499 :デフォルトの名無しさん:2016/10/05(水) 18:49:51.38 ID:zQFtnK8f.net
- 来年は JIS X 0201/0208/0213/0213/0218 の見直し時期だけど
果たして 0208 と 0213 の大統合計画は進んでいるのかしら。
- 500 :デフォルトの名無しさん:2016/10/05(水) 20:58:30.93 ID:XMn6/PJL.net
- 大統領計画に見えた
- 501 :デフォルトの名無しさん:2016/10/05(水) 21:43:58.27 ID:7xdnHvuf.net
- もうJISなんて誰も読んでないから更新するだけ無駄
- 502 :デフォルトの名無しさん:2016/10/06(木) 00:19:24.84 ID:WcwEO0Cy.net
- なんだかんだいろいろな場から参照されるしUnicodeの中の人も読まざるを得ないから
うんこ絵文字のバリエーション大量に紛れ込ませてUnicodeにUnko Supplementとして収録させるチャンス
- 503 :デフォルトの名無しさん:2016/10/06(木) 17:53:36.88 ID:UZIumrjL.net
- ウンコはIVSの240まででお願いします
- 504 :デフォルトの名無しさん:2016/10/07(金) 16:27:31.20 ID:a2swqPPf.net
- >>501
なわけないw
- 505 :デフォルトの名無しさん:2016/10/08(土) 04:31:56.90 ID:Mitr01Lo.net
- ようやく変体仮名は投票に進むことになったのか
- 506 :デフォルトの名無しさん:2016/10/10(月) 18:05:59.46 ID:YNNS+rUA.net
- >>501
刷りで字形変えるとか狂気の沙汰やで
- 507 :デフォルトの名無しさん:2016/10/10(月) 19:30:46.05 ID:cMA/MPGG.net
- >>503
そういえば例の絵文字の肌色セレクターってうんちの健康状態セレクターにも使えそうな気がしてきた
- 508 :デフォルトの名無しさん:2016/10/10(月) 22:58:01.80 ID:M8ZVX+C6.net
- うんこ色のカレーとうこん色のカレーを区別するのです
ケーキに黒っぽいVS付けたらチョコレートケーキとか
そういう汎用化は日本が提案したけど駄目だったんじゃなかったっけ?
肌の色が何とかなればいいんだってことで
- 509 :デフォルトの名無しさん:2016/10/10(月) 23:51:20.73 ID:Djs1tw8b.net
- モアイに色付けたら似てる人たくさんいるよな
- 510 :デフォルトの名無しさん:2016/10/11(火) 20:05:00.55 ID:OtV2PYG6.net
- カレー味のうんこ
うんこ味のカレー
の区別も必要(´・ω・`)
- 511 :デフォルトの名無しさん:2016/10/11(火) 21:31:06.48 ID:cObrH7jL.net
- 本来モアイじゃなくてモヤイだけどな
- 512 :デフォルトの名無しさん:2016/10/11(火) 21:50:29.29 ID:V1jdw+of.net
- >>511
だが誰も気にしない
http://emojipedia.org/moyai/
拳銃についてはあれだけ議論になるのにモヤイはモアイでいいみたい
- 513 :デフォルトの名無しさん:2016/10/11(火) 22:41:02.94 ID:rvdgZgux.net
- イースター島にあるのがモアイ、渋谷にあるのがモヤイだと思ってたw
- 514 :デフォルトの名無しさん:2016/10/12(水) 16:00:26.26 ID:YOeAxYpE.net
- 本来はそれで合ってるはずなんだけどね
- 515 :デフォルトの名無しさん:2016/10/15(土) 23:01:11.77 ID:D2M8VrAf.net
- ユニコードのUAX#29(文字・単語・段落の抽出)を久しぶりに読んでみたら
Grapheme clusterの仕様が絵文字のルールに汚染されていた。
何なんだこの絵文字推しは。
- 516 :デフォルトの名無しさん:2016/10/16(日) 12:53:03.20 ID:OdRyVeWS.net
- >>515
確かに追加されてる
けどemojiがある以上ルールを追加しないと仕方ないからしょうがない
合成使って性別modifierとかふざけてるけど
- 517 :デフォルトの名無しさん:2016/10/16(日) 23:34:01.26 ID:WgPd64pv.net
- この性別ってライオンのたてがみとか、人間以外にも使えるんだろうか
- 518 :デフォルトの名無しさん:2016/10/17(月) 16:48:56.72 ID:aoY1HCI9.net
- フィッツパトリック肌分類って6種類あるのに
何でUnicodeのEmoji Modifiersでは5つしか入れてないんだろう
"pale white skin"と"white skin"は区別しなくていいのか
- 519 :デフォルトの名無しさん:2016/10/17(月) 18:02:36.80 ID:Mub28dKn.net
- フィッツパトリック肌分類に基づいた上で1と2を一つにまとめて5段階にした
と書かれているんだから区別しなくていいと判断したんだろう
根拠は不明だが
- 520 :デフォルトの名無しさん:2016/10/17(月) 18:48:57.01 ID:V2CfCREk.net
- そこらへんすごく謎。まとめていいんかいと思った。
- 521 :デフォルトの名無しさん:2016/10/17(月) 19:58:51.95 ID:0j2VVc+B.net
- もうめちゃくちゃだよ
- 522 :デフォルトの名無しさん:2016/10/19(水) 07:22:54.68 ID:2wj1sf6o.net
- 絵文字をざっくりしたシンボルじゃなくて
なまじリアルな絵で表現し始めちゃったのがそもそもの間違いなんだよな
- 523 :デフォルトの名無しさん:2016/10/19(水) 18:20:20.85 ID:+yhFT7Q1.net
- コードポイントを追加するのはともかく
modifierみたいなコードポイント列の解釈についての
ルール追加はやめて欲しいものだ
- 524 :デフォルトの名無しさん:2016/10/19(水) 19:21:02.82 ID:z+7397V0.net
- >>515
あいつらクズばっか
文字採用基準もただの好みだし
- 525 :デフォルトの名無しさん:2016/10/27(木) 22:59:57.94 ID:N8soLWiI.net
- もうBase64か何か使って直接画像のバイナリデータ埋め込めばいいのに
Unicodeのコードポイントとして登録したがるのは何で
- 526 :デフォルトの名無しさん:2016/10/28(金) 00:02:59.53 ID:JyUwGqf8.net
- >>525
画像だったら機械可読じゃないだろ。
バニーガールの性別と人種を機械的に判別できるようにすることは世界にとって有益だろ?
- 527 :デフォルトの名無しさん:2016/10/28(金) 16:48:59.16 ID:p0VbpbVf.net
- DoCoMoのiモード絵文字がNew York近代美術館のコレクションに | スラド モバイル
https://mobile.srad.jp/story/16/10/28/0416246/
The Original Emoji Set Has Been Added to The Museum of Modern Art’s Collection – MoMA – Medium
https://medium.com/moma/the-original-emoji-set-has-been-added-to-the-museum-of-modern-arts-collection-c6060e141f61#.cqv1mudi0
New York’s MoMA Acquires the First Ever (Very Pixelated) Emoji | WIRED
https://www.wired.com/2016/10/new-yorks-moma-acquires-first-ever-pixelated-emoji/
- 528 :デフォルトの名無しさん:2016/10/28(金) 18:45:52.85 ID:TvQWNHir.net
- スレ違いレスを無言で貼るな低能
- 529 :デフォルトの名無しさん:2016/10/28(金) 20:49:51.94 ID:fbqfS+Lz.net
- 絵文字がモノクロドット絵の頃は文字コード業界も平和だったのに
- 530 :デフォルトの名無しさん:2016/10/28(金) 23:17:41.58 ID:oHvFUXop.net
- 自分たちでも扱える文字が増えたからって外人たちがはしゃぎすぎなんだよ
- 531 :デフォルトの名無しさん:2016/10/29(土) 03:01:41.79 ID:V/VqPJHP.net
- 同じものを見てるとは限らないということを
ほとんどの利用者は知らずに誤解を生んでる
- 532 :デフォルトの名無しさん:2016/10/29(土) 07:13:03.75 ID:p4X+nISr.net
- \100
- 533 :デフォルトの名無しさん:2016/10/29(土) 10:42:34.24 ID:hDIKHPTa.net
- どう転んでも表意文字とコンピュータは相性が悪いらしいな
まさか絵文字の肌の色が問題になるとは思わんかったわ
- 534 :デフォルトの名無しさん:2016/10/29(土) 10:59:34.81 ID:W9gQheBG.net
- ああいう指示は文字コードの範疇じゃないよな。
そのうちなし崩しで、ボールドにしろだのサンセリフ体にしろだのいう指示まで取り込んでしまいそうな。
- 535 :デフォルトの名無しさん:2016/10/29(土) 11:11:13.16 ID:SNFlkCRz.net
- まぁ間違いなくそのうちアニメーションさせようとか言い出すだろうな
国内では文字コード濫用形式の絵文字から、単なる画像添付のデコメ絵文字に移行してたのに
なぜわざわざ国際規格で文字コード濫用形式に戻してしまったのか
- 536 :デフォルトの名無しさん:2016/10/29(土) 14:02:02.47 ID:QoegAjAm.net
- 日本人がいろいろ工夫したものを、当の日本人自身がガラパゴスとか
言い出してダメにしちゃうから、問題点とかがきちんと伝承されないんだよ。
- 537 :デフォルトの名無しさん:2016/10/30(日) 01:29:55.53 ID:X0WLh33u.net
- EUCとかSJISとかISO2022とか揉めてる間にUTF8に持っていかれた感じ
- 538 :デフォルトの名無しさん:2016/10/30(日) 09:34:26.59 ID:VFHN3+TL.net
- そこはべつにもめてない
- 539 :デフォルトの名無しさん:2016/10/30(日) 10:57:24.93 ID:QmnxrLM3.net
- UTF-8とUTF-32に統一したいのに
WindowsがシフトジスとUTF-16の呪いをかけたままだから困る
もうWindowsごと滅んでもらうしか無い
- 540 :デフォルトの名無しさん:2016/10/30(日) 18:49:52.12 ID:K5Y8T0Gi.net
- よくわかってない人にありがちな見当違い発言
- 541 :片山博文MZ ◆T6xkBnTXz7B0 :2016/10/30(日) 18:57:43.74 ID:cdJKNnsC.net
- Windowsはメモ帳もオフィスもUTF-8ファイルに対応しているよ。
WideCharToMultiByteなどもCP_UTF8付ければ変換できる。
- 542 :デフォルトの名無しさん:2016/10/30(日) 19:06:13.90 ID:d4hFjYHp.net
- 反論になってないし片山はやっぱりアホだな
Windowsがある限りUTF-16も生き残る、まさに呪いだな
- 543 :デフォルトの名無しさん:2016/10/30(日) 20:50:41.17 ID:0D55JhhC.net
- いつも博文がクソレスで皆様を不愉快にさせて申し訳ございません
>>540のクソレスもいつものように博文がID変えた自演です
- 544 :デフォルトの名無しさん:2016/10/30(日) 20:53:09.96 ID:0D55JhhC.net
- 結合文字はともかく土吉(U+20BB7)の文字列の
長さが2になるのはホント、ストレスたまるぜ
- 545 :デフォルトの名無しさん:2016/10/30(日) 23:02:05.66 ID:qhy1bgov.net
- >>535
日本では絵文字は文字として運用実績があったからね
キャリアごとの独自絵文字をGmailで相互運用するために整理が必要だった
整理できてしまえばあとはUnicode.orgがどう考えるか
丸囲み合成文字辺りから考えると当然の帰結だったんじゃないか
- 546 :デフォルトの名無しさん:2016/10/31(月) 04:36:11.15 ID:jkUzecbb.net
- NIHON
HINOMOTO
- 547 :デフォルトの名無しさん:2016/10/31(月) 04:37:51.87 ID:jkUzecbb.net
- char * -> UTF-8
wchar_t * -> UTF-16
UTF-32 は何使うの?
- 548 :デフォルトの名無しさん:2016/10/31(月) 05:24:15.03 ID:OEIemcR6.net
- char16_t : UTF-16
char32_t : UTF-32
- 549 :デフォルトの名無しさん:2016/10/31(月) 05:26:59.82 ID:jkUzecbb.net
- dx
- 550 :デフォルトの名無しさん:2016/10/31(月) 16:40:00.60 ID:up1CNSO3.net
- 日本の3大キャリアの絵文字を収録するのはまだいいとしてもその後の毎年山盛り追加はもう何がなんだかなあ・・・
- 551 :デフォルトの名無しさん:2016/10/31(月) 16:44:21.72 ID:oRn+7MiJ.net
- KOREAの陰謀としか
- 552 :デフォルトの名無しさん:2016/10/31(月) 21:20:59.79 ID:YB1o5gLr.net
- 以下、コレはまいったね禁止
- 553 :デフォルトの名無しさん:2016/10/31(月) 21:43:52.12 ID:8iOXYzaz.net
- >>552
どういう意味?
- 554 :デフォルトの名無しさん:2016/11/01(火) 08:59:37.54 ID:f9g8VI31.net
- 親父ギャグ
- 555 :デフォルトの名無しさん:2016/11/01(火) 18:38:34.50 ID:gPz02xlo.net
- >>550
最初の頃言ってた携帯メールの交換のためとか何だったんだろうね
- 556 :デフォルトの名無しさん:2016/11/01(火) 19:26:48.90 ID:fE64ynNP.net
- 携帯絵文字は絶滅の危機
博物館で保護する必要がある
- 557 :デフォルトの名無しさん:2016/11/01(火) 20:47:25.98 ID:E4vkOEuq.net
- MoMAに収蔵されたから大丈夫
- 558 :デフォルトの名無しさん:2016/11/01(火) 20:51:59.89 ID:o060wXK0.net
- MoMAって秘宝館レベルのものも集めてるイメージ
- 559 :デフォルトの名無しさん:2016/11/01(火) 22:32:57.89 ID:SkcuWYL1.net
- ゴミみたいな絵文字が増えるのはまだいい。
JPの2文字で日本の国旗、という
クソな絵文字を持ち込んだ奴は死刑でいい。
- 560 :デフォルトの名無しさん:2016/11/02(水) 01:14:19.91 ID:FB0eoin4.net
- MoMAに収蔵されたケータイ絵文字なんてほんの一部でしかないな
- 561 :デフォルトの名無しさん:2016/11/02(水) 02:56:25.72 ID:pCipYitj.net
- >>556
オックスフォード辞典の「今年の言葉」の一つに選ばれてるくらい欧州でもインターネット上を絵文字が席巻してるんだぞ
- 562 :デフォルトの名無しさん:2016/11/02(水) 04:10:14.34 ID:6UbvFxVg.net
- >>561
まさか Unicode Emoji と ケータイ絵文字の違いを知らない?
- 563 :デフォルトの名無しさん:2016/11/02(水) 04:27:56.03 ID:pCipYitj.net
- >>562
派生関係にあるだけで同じものです
対応表もあります
- 564 :デフォルトの名無しさん:2016/11/02(水) 17:23:17.15 ID:foEqKcGp.net
- >>563
560はそんな大雑把な話ではないでしょ
- 565 :デフォルトの名無しさん:2016/11/03(木) 03:34:51.76 ID:iYejUQc8.net
- 文字コードてすと
surströmming
- 566 :デフォルトの名無しさん:2016/11/03(木) 19:21:23.08 ID:SywuufG2.net
- >>319
https://www.facebook.com/koichi.yasuoka.5/posts/1109283619130554
- 567 :デフォルトの名無しさん:2016/11/04(金) 15:58:47.69 ID:fFiZW1of.net
- >>559
🇸🇪🇸🇪
ってTwitterに書き込んだらスウェーデンの国旗に対応してなくて
間の二文字がスペインの国旗として認識・表示されたって話
マヌケですき
- 568 :デフォルトの名無しさん:2016/11/04(金) 16:48:18.71 ID:LPswLb4k.net
- >>567
え、なんだそれ。
てっきり1文字目用と2文字目用で別のポイントになってるのか、
あるいは始点か終点を示す符号があるんだと思ってた。
単に2文字続けば国、って仕様なのか。Unicodeも悪いな。
- 569 :デフォルトの名無しさん:2016/11/04(金) 22:15:07.10 ID:oa5V2Sux.net
- Unicode関係ないw
- 570 :デフォルトの名無しさん:2016/11/04(金) 22:48:05.41 ID:z+k+W3df.net
- いや関係あるでしょ。
UTF-16のように1文字目と2文字目を分けておけばそんなことにはならなかった。
- 571 :デフォルトの名無しさん:2016/11/04(金) 23:05:51.48 ID:uRr6P/SX.net
- TwitterがUnicodeに完全に対応してればそんなことにはならなかった。
- 572 :デフォルトの名無しさん:2016/11/04(金) 23:59:11.84 ID:yGjCinWT.net
- >>571
完全に対応kwsk
国旗周りの処理の詳しい規定ってあったっけ
- 573 :デフォルトの名無しさん:2016/11/05(土) 00:13:28.08 ID:xEDyoPf+.net
- 前後の区別がないと、SUSE とかのときどうするのか気になる。
単純に区切ると SU | SE で
[ソ連国旗] [スウェーデン国旗]
だけど、SU の国家は現存しない。
だとすると別の可能性として S | US | E 、つまり
[S] [米国国旗] [E]
もありえそう。
- 574 :デフォルトの名無しさん:2016/11/05(土) 01:01:33.47 ID:gWLGUGo0.net
- >>573
> [S] [米国国旗] [E]
普通に先頭から判別すればそうなる
少なくてもfirefoxではたぶんそう→ 🇸🇺🇸🇪
- 575 :デフォルトの名無しさん:2016/11/05(土) 01:16:57.65 ID:mXzE/KRi.net
- どの2文字をペア扱いすべきかはISO国名コードの最新版に存在するかどうかを見ないと分からないってことか。ややこしいな。
- 576 :デフォルトの名無しさん:2016/11/05(土) 01:20:47.71 ID:mXzE/KRi.net
- いや、最新版だけじゃだめなのか。過去のメールは送信当時のコード表を使わないと>>574みたいに半分ズレて別の国に化けるな。
- 577 :デフォルトの名無しさん:2016/11/05(土) 01:57:45.33 ID:fdLm2JUj.net
- 既にGB-SCT(英国スコットランド)とか提案されてるし気にしても仕方ない
- 578 :デフォルトの名無しさん:2016/11/05(土) 04:17:16.49 ID:fdfHcDbP.net
- >>572
偶数で切ることになっている
UAX#29
『Do not break within emoji flag sequences. That is, do not break between regional indicator (RI) symbols if there is an odd number of RI characters before the break』
『[^RI] (RI RI)* RI×RI』
UTS51
『A sequence of two Regional Indicator characters』
- 579 :デフォルトの名無しさん:2016/11/05(土) 04:21:04.76 ID:fdfHcDbP.net
- ↑の「×」はコードポイント列から一文字を抽出するときに
別の文字に切り離してはいけないという意味
- 580 :デフォルトの名無しさん:2016/11/05(土) 07:07:22.79 ID:r4TaQ56a.net
- >>574
firefox ESR(45.4.0)では国旗フォントがあるかどうかで区切りが変わるいい加減さ
sssp://o.8ch.net/irg8.png
- 581 :デフォルトの名無しさん:2016/11/05(土) 12:09:56.76 ID:i7MWnHHH.net
- >>580
いい加減というか逆にめんどくさいことをわざわざって気がする
- 582 :デフォルトの名無しさん:2016/11/05(土) 14:59:08.75 ID:vOTzCdKc.net
- >>577-578
GBSCTGBSCTと2つ並べるとGB SC TG BS CT に分解されそう(最後のCT以外全部あるっぽい)。
- 583 :デフォルトの名無しさん:2016/11/05(土) 16:22:05.99 ID:qKcyypJI.net
- DNAの塩基配列も文字コードになったんでしたっけ?
- 584 :デフォルトの名無しさん:2016/11/05(土) 16:44:27.42 ID:9npC26KJ.net
- 絵とスタイルは別のフォーマットがあるんだからそっちに委ねるべきだよな
もともとそういう方針のはずだし
- 585 :デフォルトの名無しさん:2016/11/05(土) 17:02:26.62 ID:9y8+ngHb.net
- >>577
GB-○○と同じ要領でJP-○○で都道府県旗も出せるようになるのかな、と思ったけど、
よく考えたらRIってアルファベットしかないから数字使うJP-○○は無理やん。欧米ずるい。
俺も神奈川県のおちんちんマーク出したい。
http://www.pref.kanagawa.jp/uploaded/image/700113.gif
- 586 :デフォルトの名無しさん:2016/11/05(土) 17:54:33.18 ID:Cvv2kfJC.net
- iconvライブラリがマルチスレッド対応してない…。orz
- 587 :デフォルトの名無しさん:2016/11/05(土) 18:44:59.50 ID:6heu2Wv+.net
- ICUを使ってみては
- 588 :デフォルトの名無しさん:2016/11/05(土) 21:04:55.16 ID:TjgsNfuE.net
- >>585
TK=東京とかKN=神奈川みたいなのを決めりゃいいじゃん
- 589 :デフォルトの名無しさん:2016/11/05(土) 21:24:55.77 ID:BG7LImn0.net
- 絵文字のために3166-2:JPを更新するの?
- 590 :デフォルトの名無しさん:2016/11/05(土) 22:48:27.66 ID:ALhaJQoB.net
- REGIONAL INDICATOR SYMBOLSってISO 3166-1の形式に従う必要はあったのだろうか
- 591 :デフォルトの名無しさん:2016/11/05(土) 23:08:08.40 ID:BG7LImn0.net
- 従うというか、ISOに外部化しないとどの旗を収録するか(→どこを国家とみなすか)で揉めてしまう。
純粋に人任せにすることで「うちは政治的判断はしてませんよ」ってそ知らぬふりができる。
- 592 :デフォルトの名無しさん:2016/11/05(土) 23:31:17.53 ID:Cvv2kfJC.net
- >>587
助言ありがとう。ICU、試してみます。
- 593 :592:2016/11/06(日) 15:59:49.80 ID:0naNG629.net
- iconvがマルチスレッド対応していないってのは私の勘違いだった。
icuとiconv、両方ともマルチスレッド対応していた。
Win32環境での文字コード変換の速度比は以下の通りになった。
Win32API は、WideCharToMultiByte() 等を使った。
Win32API : cygwin-iconv : cygwin-icu = 1 : 3 : 2
- 594 :デフォルトの名無しさん:2016/11/06(日) 16:12:34.47 ID:bCh//xB2.net
- 速度比?
時間比じゃなくて?
- 595 :592:2016/11/06(日) 16:49:22.61 ID:0naNG629.net
- やはり波ダッシュ「〜」、「〜」が鬼門。
>>594
失礼しました。所要時間の比です。
- 596 :デフォルトの名無しさん:2016/11/06(日) 18:14:05.21 ID:O2/niCOA.net
- >>586
glibcのiconvはMT-Safe
ただiconv_openの返り値(iconv_t)は排他して使わないと駄目
- 597 :592:2016/11/06(日) 19:53:07.52 ID:0naNG629.net
- なぜiconvがマルチスレッド対応してないと思い込んでしまったかというと、
cygwinでC++11の thread クラスで work() と join() を使ったマルチスレッドの小さい勉強用プログラムを試しに書いたんだけど、
処理の所要時間を得るために、clock()で計時したんだけど、その数値がデタラメだったことが原因。
cygwinのclock()の戻り値の信頼性がここまで低いとは知らなかった。
>>596
了解。ハンドルを複数スレッドで使いまわすつもりは最初からなかったです。
ライブラリ関数内部で排他ロックしてるのかと思い込んだ私のミス。
処理速度・将来性・プロジェクトの活発さを考えると、iconvよりicuの方が有望に思える。
- 598 :デフォルトの名無しさん:2016/11/06(日) 20:21:34.70 ID:t7rcT7E/.net
- 次はmingwでもテストしてくれ
- 599 :592:2016/11/06(日) 23:12:19.37 ID:0naNG629.net
- mingw系は、GitやStrawberry Perlに付属のMINGWのbinがPATHに入り込んでいて、無事にmakeを貫徹することさえままならないので当分報告できない。あしからず。
- 600 :デフォルトの名無しさん:2016/11/06(日) 23:41:14.17 ID:eMFucsGq.net
- プログラムを組むような人なら普通はPATHなんていくらでも変更出来るけど
ままならないなら仕方ない
- 601 :デフォルトの名無しさん:2016/11/07(月) 04:13:30.95 ID:EaPQMBZD.net
- >>599
インストーラーが「PATHを設定しますか?」で選択しを与えてくれてるのに
読まないでパコパコインストールしまくる馬鹿ですね
- 602 :デフォルトの名無しさん:2016/11/07(月) 15:01:03.67 ID:/3CQ/LxZ.net
- これ以上片山に構わないで
- 603 :デフォルトの名無しさん:2016/11/07(月) 16:58:00.20 ID:zyvBBkK2.net
- >>582
マジレスしていいのかわからんがそれはISO 3166-1じゃなくてISO 3166-2だろと
- 604 :デフォルトの名無しさん:2016/11/07(月) 17:22:52.58 ID:Tzo661xQ.net
- マジレスはいいが前後も読んだほうがより良い
- 605 :デフォルトの名無しさん:2016/11/07(月) 17:45:16.90 ID:2+R9ECvu.net
- なお、3166-2のやつはRI使わない方向のようなのでほとんどの問題は解決されそう。
ただそうなるとますますあの不出来なRIって何だったのかって感じに。
- 606 :592:2016/11/07(月) 22:27:59.51 ID:6EByQkLc.net
- mingwでiconv, icuを試した。
iconvは、MINGW Installation Managerが提供するバイナリを使用した。
icuはバイナリは提供されていないのでソースからビルドした。
icuはそのままだとlocale関連のAPIが公開されていないMINGW版がビルドができないので、
_create_locale() と _free_locale() のダミー関数をソースに追記してビルドを通した。
所要時間の比は以下の通り。
MINGWだと、iconv、icuともWin32とあまり違いがないようだ。
Win32API : mingw-iconv : mingw-icu = 1 : 1.08 : 1.11
なお、>>593 でのcygwinは、iconv、icuともにcygwin用に提供されているバイナリを利用している。
- 607 :デフォルトの名無しさん:2016/11/08(火) 00:48:57.53 ID:unHUC1CF.net
- cygwin1.dllとか軽油してるから遅いんだろ
- 608 :デフォルトの名無しさん:2016/11/08(火) 01:14:10.78 ID:Q1ozlGt4.net
- 変換する文字列の長さが短すぎて
変換速度よりもsystem callの呼び出し速度のベンチになってない?
- 609 :デフォルトの名無しさん:2016/11/08(火) 09:16:34.50 ID:WBfil5Sr.net
- 生の値(時間)を書くのが普通
比率という時点で何か隠してるようにみえる
- 610 :デフォルトの名無しさん:2016/11/08(火) 11:50:26.32 ID:ZBAGJV1u.net
- するどいな
- 611 :592:2016/11/08(火) 20:34:22.36 ID:qWOFxdzf.net
- 無駄な情報を捨てて必要な情報だけ提供した善意を、悪意を持って隠したと曲解する人がいて面白い。トランプ支持者っぽい。
テストプログラムやら実行環境やらまで公開して他の人が再現できるようにでもしない限り、生の実測時間を提示する意味はない。
- 612 :デフォルトの名無しさん:2016/11/08(火) 20:41:20.43 ID:IHq5KhUT.net
- トランプ流れ弾
- 613 :デフォルトの名無しさん:2016/11/08(火) 22:32:50.94 ID:HtqjUltN.net
- 同じ10倍でも例えばミリ秒のオーダーと秒のオーダーでは全然違う。
計測時間そのままコピペする方が楽だろうに、態々比率に直すのは、、、
パワポ資料作るお仕事の人と見た。
- 614 :デフォルトの名無しさん:2016/11/10(木) 16:00:00.53 ID:UEg1zsO/.net
- JIS X 0201/0208/0213がいつの間にか
> 2016-10-20 確認
になってる。
今回は特に何もなしか(あったらまた困るけど)
というか改正来年じゃなかったのか……。
- 615 :デフォルトの名無しさん:2016/11/10(木) 20:40:08.56 ID:Ow2XdUNn.net
- 来年が色んな意味で楽しみだわ
- 616 :デフォルトの名無しさん:2016/11/11(金) 13:37:59.96 ID:8vg+pXNE.net
- JISってそれぞれ何刷まで出てるんだっけ?
刷ごとの差分知りたい
- 617 :デフォルトの名無しさん:2016/11/11(金) 15:58:27.67 ID:Y1SxtmaI.net
- 0208の1978年版とか2012年版とかじゃなくて刷?
ttp://okazaki.sakuraweb.com/biboroku/78jis/78jis.html
によるとJIS C 6226-1978は少なくとも第7刷まで増刷されたらしいけど、
JSAとかJISCに問い合わせても多分当時の資料とか無いだろうな。
- 618 :デフォルトの名無しさん:2016/11/12(土) 15:38:19.16 ID:q7jUFepj.net
- >>616
刷は改定ごとに一から始まるので刷ごとの差は無い
そしてJISは様々な規格があるのでJISが何刷ということは言えない
- 619 :デフォルトの名無しさん:2016/11/13(日) 13:47:22.48 ID:ueOqX8wJ.net
- 78JIS以外は何刷でも内容一緒でしょ正誤票の反映はあるだろうけど
- 620 :デフォルトの名無しさん:2016/11/14(月) 16:40:47.78 ID:nhwER5sG.net
- Unicode 10.0の絵文字候補、人魚は男女対応可能に | スラド IT
http://it.srad.jp/story/16/11/12/191218/
まーた増えるのか、、、
- 621 :デフォルトの名無しさん:2016/11/14(月) 16:57:09.25 ID:YqiB904W.net
- なんでもかんでもZWJでいくなら最初から人間+魚でよかった。
そしてうっかり順番を入れ替えて魚+人間にすると……!!
- 622 :デフォルトの名無しさん:2016/11/14(月) 17:40:54.01 ID:rIoU2mi1.net
- マーパーソンwww
- 623 :デフォルトの名無しさん:2016/11/14(月) 17:48:16.83 ID:rIoU2mi1.net
- 俺がもっとクールな新絵文字考えたぜつって、合字でオレオレ絵文字ZWJ実装するフォントが現れだして収集つかなくなりそう
- 624 :デフォルトの名無しさん:2016/11/14(月) 18:00:03.62 ID:zlxXdLUF.net
- これはひどい
- 625 :デフォルトの名無しさん:2016/11/14(月) 18:50:06.09 ID:YqiB904W.net
- >>623
うわありそうで怖い。
PUAと違って意味があるぶん、
大手が流行らせた合成絵文字はそのまま追認するしかない未来が見える。
例えばTwitterとか、Android OSとかがオレオレ絵文字実装したら
一般人が違いに気付かずに使って膨大な使用例ができるよね……
- 626 :デフォルトの名無しさん:2016/11/15(火) 12:41:03.82 ID:r6BgB6bM.net
- ZWJ方式は、合成されなくても意味は通じるってことでしょ
- 627 :デフォルトの名無しさん:2016/11/15(火) 13:27:53.08 ID:U3Mmtdzs.net
- WhatsAppがかんがえたさいきょうのZWJ絵文字
http://emojipedia.org/olympic-rings/
なお合成されなかったら意味は通じない模様
- 628 :デフォルトの名無しさん:2016/11/15(火) 21:17:34.07 ID:gEiNDmpT.net
- ちゃんと色指定も加え入れろ〜
- 629 :デフォルトの名無しさん:2016/11/15(火) 21:50:35.83 ID:PldPJ2O3.net
- 合成するぐらいなら
文字列の途中にエンコードしたビットマップを挟み込めるようにしろ
- 630 :デフォルトの名無しさん:2016/11/15(火) 21:55:34.62 ID:cUgefh1P.net
- ─○○○
- 631 :デフォルトの名無しさん:2016/11/16(水) 02:59:36.67 ID:zr+5k25B.net
- >>627
大きい丸自体が元をたどれば合成文字用なのが面白い
- 632 :デフォルトの名無しさん:2016/11/16(水) 02:59:39.09 ID:fzskfnoe.net
- 談合三本
- 633 :デフォルトの名無しさん:2016/11/16(水) 03:01:10.13 ID:fzskfnoe.net
- >>629
たしかに
- 634 :デフォルトの名無しさん:2016/11/16(水) 16:58:25.31 ID:uL/NV7s7.net
- むしろ合成したいなら U+20DD COMBINING ENCLOSING CIRCLE なんじゃ
- 635 :デフォルトの名無しさん:2016/11/19(土) 01:04:22.83 ID:/7Uc3cKm.net
- ツ郤衙ワ
https://www.google.co.jp/#q=%EF%BE%82%E9%83%A4%E8%A1%99%EF%BE%9C
- 636 :デフォルトの名無しさん:2016/11/19(土) 21:24:14.40 ID:h19DOfQp.net
- >>617
>>618
刷はある
同じ規格のはずなのに刷で例示字形に差がある時もあって、それを整理したいんだよね
- 637 :デフォルトの名無しさん:2016/11/20(日) 03:55:56.72 ID:pv3IyT3Y.net
- 古典の研究は資料の調査収集から始まる
- 638 :デフォルトの名無しさん:2016/11/24(木) 20:15:24.01 ID:V+CGDzRP.net
- ーヲノイクゥ
イャサウクゥ
ケ篥ホクゥ
ケュナ邵ゥ
サースナクゥ
サウキチクゥ
ソキウ羣ゥ
タ鯱ユクゥ
タナイャクゥ
ツ郤衙ワ
ツ醋ャクゥ
トサシ雕ゥ
ナ郤ャクゥ
ニ猥ノクゥ
ニチナ邵ゥ
ニハフレクゥ
ノルサウクゥ
ハ。ー貂ゥ
ハ。イャクゥ
ハ。ナ邵ゥ
ハシクヒクゥ
ヒフウ、ニサ
マツイホサウクゥ
- 639 :デフォルトの名無しさん:2016/11/25(金) 09:57:28.56 ID:M66ENQJY.net
- 愛媛県
岡山県
高知県
広島県
三重県
山形県
新潟県
千葉県
静岡県
大阪府
大分県
鳥取県
島根県
奈良県
徳島県
栃木県
富山県
福井県
福岡県
福島県
兵庫県
北海道
和歌山県
- 640 :デフォルトの名無しさん:2016/11/25(金) 12:21:36.58 ID:n3LE76D7.net
- マツイホサウ
https://www.google.co.jp/search?q=%E3%83%9E%E3%83%84%E3%82%A4%E3%83%9B%E3%82%B5%E3%82%A6
- 641 :デフォルトの名無しさん:2016/12/19(月) 05:55:33.94 ID:rp7MwxOA.net
- さて
- 642 :デフォルトの名無しさん:2016/12/26(月) 16:22:22.18 ID:dYEGDg58.net
- ISO/IEC 10646:2016 (5th Edition)は2017になりそうだな。
- 643 :デフォルトの名無しさん:2016/12/26(月) 20:13:30.11 ID:TRnwbnfO.net
- イロハコードがあるって初めて知った
http://nukalumix.hateblo.jp/entry/nenkin_iroha
https://www.taro.org/2016/12/%E3%81%84%E3%82%8D%E3%81%84%E3%82%8D%E3%82%A4%E3%83%AD%E3%83%8F%E3%81%AA%E7%9A%86%E6%A7%98%E3%81%B8.php
http://nlab.itmedia.co.jp/nl/articles/1612/12/news127.html
- 644 :デフォルトの名無しさん:2016/12/28(水) 05:19:29.60 ID:cqk+d7uG.net
- コード?
- 645 :デフォルトの名無しさん:2016/12/28(水) 07:28:33.43 ID:XevzpVey.net
- >>110
おいおい、ちゃんと規格読んでる?
原則、部首画数順だぞ。unihanデータベースも推奨ソートキーが部首画数順になってる。
- 646 :デフォルトの名無しさん:2016/12/28(水) 07:35:34.89 ID:XevzpVey.net
- >>160
昔の区点表現でいう2区毎にまとめて突っ込んだせいだろう。
- 647 :デフォルトの名無しさん:2016/12/28(水) 07:42:45.19 ID:XevzpVey.net
- >>244
いわゆるハングルの大移動ですね。
- 648 :デフォルトの名無しさん:2016/12/28(水) 09:58:25.05 ID:aMFxqRcr.net
- 突然遠投大会始めるのやめてもらえます
- 649 :デフォルトの名無しさん:2016/12/28(水) 12:34:27.60 ID:kFL7wfb2.net
- >>644
50音カナで50進数にして管理してるんだと
- 650 :デフォルトの名無しさん:2016/12/28(水) 13:11:56.04 ID:hpQZCApo.net
- カナって50個もあるの?
- 651 :デフォルトの名無しさん:2016/12/28(水) 13:14:02.87 ID:45reyBmE.net
- もっとある
- 652 :デフォルトの名無しさん:2017/01/01(日) 20:44:48.93 ID:4U7a/Vzr.net
- 明けましておめでとうございます
2017年の文字コード業界はどうなるやら
- 653 :デフォルトの名無しさん:2017/01/01(日) 21:18:20.53 ID:9MvoRZrQ.net
- VCでUTF-8のBOM無し突っ込めると判ったのが2016の最大の収穫
- 654 :デフォルトの名無しさん:2017/01/06(金) 14:36:30.66 ID:XtKi9eaG.net
- test
- 655 :デフォルトの名無しさん:2017/01/19(木) 22:54:33.86 ID:xPn9j90t.net
- testだと?
- 656 :デフォルトの名無しさん:2017/01/19(木) 23:22:23.28 ID:kAhgSygC.net
- ユニコードコンソーシアムのProposed New Charactersみてたら
HIRAGANA LETTER SMALL WI、HIRAGANA LETTER SMALL WE、HIRAGANA LETTER SMALL WO、
KATAKANA LETTER SMALL WI、KATAKANA LETTER SMALL WE、KATAKANA LETTER SMALL WO、
KATAKANA LETTER SMALL N
つまり小さい「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」があった。
小さい「こ」と「コ」は以前U+1B002とU+1B003に提案されてたが
そこは変体仮名が入ることになってU+1B127、U+1B128に変わってた。
変体仮名の数が多すぎてKana Supplementブロックに入り切らなかったから
その直後のU+1B100〜U+1B12FにKana Extended-Aブロックを作るんだな。
でU+1B100〜の予定だった女書は1B170〜にずれた。
- 657 :デフォルトの名無しさん:2017/01/19(木) 23:41:32.39 ID:L5ppZzRV.net
- 荒らしは去れ
ここはトイレの落書きやお前の日記ではない
- 658 :デフォルトの名無しさん:2017/01/19(木) 23:58:14.21 ID:xPn9j90t.net
- 佳那サプリメントでかいなあと思ってたのに足りなかったのか
- 659 :デフォルトの名無しさん:2017/01/20(金) 01:09:17.45 ID:1c/0Zcpc.net
- >>656
女書ってなに?
- 660 :デフォルトの名無しさん:2017/01/20(金) 04:21:35.39 ID:SuI25zgd.net
- 美乳
- 661 :デフォルトの名無しさん:2017/01/20(金) 08:06:23.41 ID:B05iL6IP.net
- ↑いまだにEUC使ってる奴
- 662 :デフォルトの名無しさん:2017/01/20(金) 08:57:48.31 ID:TRhLZIcU.net
- 芸柏l
- 663 :デフォルトの名無しさん:2017/01/20(金) 13:48:47.52 ID:XOQ1SR2o.net
- 平成
- 664 :デフォルトの名無しさん:2017/01/20(金) 16:02:46.66 ID:HZJT4SPy.net
- UTF-8と称しつつ実際はISO/IEC 8859-1(or Windows-1252)使ってるサイト早く絶滅しないかな〜。
- 665 :デフォルトの名無しさん:2017/01/20(金) 23:22:01.31 ID:2XlTkpSB.net
- うむ
- 666 :デフォルトの名無しさん:2017/01/22(日) 23:54:36.79 ID:I5eFmZgm.net
- シマンテックのインストーラー「Symantec? Veritas NetBackup?をインストールします」
俺「俺は今 何をインストールしているんだぜ…?」
- 667 :デフォルトの名無しさん:2017/01/23(月) 13:38:14.82 ID:vFvi2mPp.net
- マカフィー()よりまし
- 668 :デフォルトの名無しさん:2017/01/25(水) 14:44:24.88 ID:/N/oPPcM.net
- ©と®が化けるのはあるある
- 669 :デフォルトの名無しさん:2017/01/25(水) 15:54:19.97 ID:O1e4fHbH.net
- Windows 2000あたりのセットアップ画面(ブルースクリーン)は左上に
ソソソソソソソ
みたいなのが並んでた気がするんだけどあれは何が化けていたんだろう。
- 670 :237:2017/01/25(水) 22:09:22.42 ID:gTVlV55T.net
- >>669
CP437?
- 671 :デフォルトの名無しさん:2017/01/25(水) 23:28:05.93 ID:yhKKEJSl.net
- CP237?
- 672 :デフォルトの名無しさん:2017/02/03(金) 11:13:08.06 ID:qUN7oehH.net
- >>669
頭にオがあったんじゃないかな
- 673 :デフォルトの名無しさん:2017/02/03(金) 15:53:54.77 ID:AImPimr2.net
- ソじゃなくてヘだな
Windows 2000 Setup
ヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘヘ
- 674 :デフォルトの名無しさん:2017/02/06(月) 16:58:49.11 ID:1iv5Awq0.net
- >>669-673
なるほど、
https://en.wikipedia.org/wiki/Code_page_437
https://ja.wikipedia.org/wiki/JIS_X_0201
最初は CP437 の 0xCD “═” だったのが
何かの拍子にシフトJISとして解釈されて
JIS X 0201 の 0xCD “ヘ” に化けたということか。
- 675 :デフォルトの名無しさん:2017/02/06(月) 21:27:31.96 ID:oVOmv7r6.net
- >>674
正体は罫線か。
こういう解明ってすっきりするし面白いね。
- 676 :デフォルトの名無しさん:2017/02/19(日) 22:58:26.35 ID:IU+vTkdD.net
- ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
http://www.iso.org/iso/catalogue_detail.htm?csnumber=69119
ISO/IEC 10646:2017 (5th Edition) がいつの間にか published になってた。
Publicly Available Standards へ追加マダァ-? (・∀・ )っ/凵⌒☆チンチン
- 677 :デフォルトの名無しさん:2017/02/20(月) 22:24:53.34 ID:coRAUu9w.net
- >いつの間にか published になってた
文盲ってどうしようもないですねホント
- 678 :デフォルトの名無しさん:2017/02/20(月) 23:48:25.19 ID:SiY39E3I.net
- regional flagsって日本の都道府県旗も追加されんの?
東京の旗が銀杏か肛門かで揉めそう
- 679 :デフォルトの名無しさん:2017/02/21(火) 00:45:25.29 ID:nlr0ZxeU.net
- ってか日本の都道府県旗ってJISか何かで規格化されてるんだろうか
されてないなら根拠になる個別の条例を探して判断することになるのか
- 680 :デフォルトの名無しさん:2017/02/21(火) 23:08:13.81 ID:YiL5XD0V.net
- 東京のマンコマークと神奈川のチンチンびろーんは世界の恥
- 681 :デフォルトの名無しさん:2017/02/22(水) 03:17:26.03 ID:4ggKEg2C.net
- 旗の形ではなく県章部分だけでグリフ作ってもらえたらいろいろ独創的な応用が利きそうだ。
- 682 :デフォルトの名無しさん:2017/02/22(水) 18:49:19.58 ID:/iBgHjnm.net
- >>679
絵と絵文字は別物やで
- 683 :デフォルトの名無しさん:2017/02/22(水) 21:52:33.48 ID:h5L2bR5S.net
- >>682
?
言わんとすることがわからないけど、
基準があれば>>678みたいな場合に難しい判断しなくてすむでしょ?
- 684 :デフォルトの名無しさん:2017/02/22(水) 22:31:09.15 ID:j43AF9m9.net
- もう憲法とか国境の位置もJIS規格で管理しちゃえよ
- 685 :デフォルトの名無しさん:2017/02/23(木) 13:21:45.70 ID:eG9NqkD/.net
- >>680
知らなかった
ありがとう
2ちゃんもたまには役に勃つな
- 686 :デフォルトの名無しさん:2017/02/23(木) 13:22:51.89 ID:eG9NqkD/.net
- >>681
自分でやれ
- 687 :デフォルトの名無しさん:2017/02/23(木) 18:33:49.17 ID:g/wbAq9q.net
- >>683
仕様書読もうな
- 688 :デフォルトの名無しさん:2017/02/23(木) 19:43:12.70 ID:lh6GP4kZ.net
- 🏳️🌈
🏴☠️
- 689 :デフォルトの名無しさん:2017/02/23(木) 23:02:08.28 ID:Mc4LemLc.net
- >>687
どうもかみ合ってない気がする。
仕様できっちり規定されてれば楽だけどそういうものじゃないよね、
なら代わりになる典拠があれば楽なんだけどな、って話してたつもりなんだけど。
- 690 :デフォルトの名無しさん:2017/03/02(木) 13:04:44.68 ID:Dk3HQyow.net
- 仕様を読んだ上でそんなこと言ってるなら、読解力が足りないとしか言えないわ
- 691 :デフォルトの名無しさん:2017/03/02(木) 15:42:40.27 ID:fgh+r4bY.net
- せっかく亀レスするならもうちょっと具体的に言えたほうがいいと思う
- 692 :デフォルトの名無しさん:2017/03/03(金) 19:38:34.87 ID:r16C7uTR.net
- もういくつ寝るとunicode10
ゾンビとか吸血鬼とかせっそうなさすぎ
こんな絵文字使われるのかよ
- 693 :デフォルトの名無しさん:2017/03/03(金) 22:57:47.99 ID:m0VSWGlS.net
- もう幾つ寝るとISO 10646発売
あと一週間ぐらいで出るだろきっと
- 694 :デフォルトの名無しさん:2017/03/04(土) 12:37:47.12 ID:GRvQ2lmz.net
- >>692
他にやることあるのにね
無能なんだろ
- 695 :デフォルトの名無しさん:2017/03/04(土) 17:17:33.70 ID:eGgxEr5u.net
- すべての文字を収めるが目的のはずが
新しいアイコンを作ろうになってるからな
- 696 :デフォルトの名無しさん:2017/03/04(土) 23:52:53.04 ID:+pEijc2g.net
- 絵文字なんか作ったってフォントごとに微妙に変わるし不毛だよ
何種類用意したって満足ってことはないし、無駄な仕事が増えるだけ
それならむしろ、エンコードしたビットマップかベクタグラフィックを
文字列の途中に文字として挿入できるようにしたほうがマシだろ
- 697 :デフォルトの名無しさん:2017/03/05(日) 00:03:46.99 ID:xrJm/RDc.net
- 100種類用意しました
1000種類用意しました
10000種類用意しました
・・・
どこまでいってもこんなものは・・・
絵文字っていわゆるラインスタンプみたいな使われ方を想定しているんだろ?
すべてのラインスタンプに文字コードを割り振るみたいなものだ
時代に合ってない
文字列の途中にビットマップかベクタグラフィックを挟み込める方が絶対良いって
そうすると当然絵文字職人みたいな人たちが出てきてにぎわうだろうから
それをコピペして使えばよいのだ
標準化委員会みたいな中央で絵の形とコードを取り決めて・・・ってスタイルは時代遅れだよ
ラインスタンプを見ろよ
- 698 :デフォルトの名無しさん:2017/03/05(日) 23:06:39.70 ID:nindsAFW.net
- たしかに
特定のコードとそれに続く何byteかでbitmap図形っていうのはありかもね
無駄多いけど
- 699 :デフォルトの名無しさん:2017/03/06(月) 08:18:41.33 ID:n/Fv95sm.net
- 最近の追加は絵文字じゃなくて絵になってるからな
文字コードに色を定義したり芯のない継接ぎ仕様でやりたい放題だよな
- 700 :デフォルトの名無しさん:2017/03/14(火) 14:00:09.20 ID:+au4v4OR.net
- Unicode 10、変体仮名と縦書きレイアウト導入へ | マイナビニュース
http://news.mynavi.jp/news/2017/03/13/110/
- 701 :デフォルトの名無しさん:2017/03/15(水) 08:13:46.98 ID:eV3tx5Ei.net
- 縦書きテキストレイアウトってまたおかしなことになってんな
変体仮名は文字情報基盤の範囲ならいいんじゃね
- 702 :デフォルトの名無しさん:2017/03/15(水) 08:24:44.07 ID:oPhy6OQw.net
- 縦書きレイアウトって前からあるこれのアップデートのことじゃないの?
http://www.unicode.org/reports/tr50/tr50-18.html#Modifications
「導入」ってのはその記事の誤認っぽい
- 703 :デフォルトの名無しさん:2017/03/15(水) 11:37:12.40 ID:7YWEdixI.net
- |のカーニングがおかしいとか
- 704 :デフォルトの名無しさん:2017/03/15(水) 15:48:49.66 ID:tq6fONxP.net
- 「導入」ってのは
> さらに、Unicode Vertical Text Layoutが標準の一部として取り込まれる点が注目される。
って本文に書いてあるんだから Unicode® Technical Report が Unicode® Standard Annex に昇格して
Unicode® Standard の一部になるってことでしょ。
- 705 :デフォルトの名無しさん:2017/03/28(火) 20:45:37.67 ID:2V3Jlzjb.net
- おう吐・ゾンビ・授乳などUnicodeに新しい絵文字69種類が追加される
http://gigazine.net/news/20170328-69-new-emojis-announced/
- 706 :デフォルトの名無しさん:2017/03/28(火) 22:50:13.41 ID:ky5+niZ/.net
- こんだけ増えてくると幾らアホなアメリカ人でも
UTF-16捨てたくなってくるだろ
- 707 :デフォルトの名無しさん:2017/03/29(水) 08:08:48.71 ID:81RbfoHk.net
- こういう流行り廃りのあるものはMarkdown emojiのようなやり方で十分だしそっちの方が
便利だと思うがなぁ。そもそも欧米の連中、Unicode入力のためにIMEとか導入してるんだろうか?
- 708 :デフォルトの名無しさん:2017/03/29(水) 12:59:49.14 ID:v2ySqvAX.net
- イングランド、スコットランド、ウェールズは入れたのに北アイルランドは入れなかったのか
しかし U+1F3F4 U+E0067 U+E0062 U+E0065 U+E006E U+E0067 U+E007F を一つの国旗として処理しろってそれは
- 709 :デフォルトの名無しさん:2017/03/29(水) 14:50:05.48 ID:IUBNo9UW.net
- ほらもうこれ、いったい何に使うのっていう
ラインスタンプと比べるともはや・・・
まるで社会主義国家のようだし
今の時代の速度感と全然合ってないんですけど
- 710 :デフォルトの名無しさん:2017/03/29(水) 17:07:28.23 ID:WAel0act.net
- >>706
UTF-8ならいいの?
- 711 :デフォルトの名無しさん:2017/03/29(水) 18:47:22.40 ID:pMdWiHKE.net
- >>710
そういう意味じゃないでしょ
Unicodeに政治を持ち込むなっていう
- 712 :デフォルトの名無しさん:2017/03/29(水) 21:14:02.55 ID:81RbfoHk.net
- 「emojiが使えないUTF-16はオワコン」て意味かと思った。
- 713 :デフォルトの名無しさん:2017/03/30(木) 01:24:25.07 ID:4z103Fgo.net
- iOS 10.3リリース、ファイルシステムがHFS+からAPFSに変更される
https://apple.srad.jp/story/17/03/29/0852227/
Apple、Unicode正規化(もどき)やめるってよ
- 714 :デフォルトの名無しさん:2017/03/30(木) 07:57:02.00 ID:HGkR55tR.net
- U+41 U+0307 U+0308と
U+41 U+0308 U+0307のファイルが同時に作成できるのかな
- 715 :デフォルトの名無しさん:2017/03/31(金) 16:24:48.85 ID:jxXitrEX.net
- http://www.taishukan.co.jp/kokugo/webkoku/series003_03.html
Windowsと同じ「がが」というフォルダを4つ作れるようになるのか
- 716 :デフォルトの名無しさん:2017/03/31(金) 18:39:57.95 ID:cAvSJqfg.net
- > 少なくとも検索に関しては、「ガ」と「ガ」を同じにみなす必要があり、
> <U+FF76 U+FF9E>とU+30ACと<U+30AB U+3099>とを、 全て同じだとみなす必要があるということでしょう。
安岡は何当たり前のこと言ってんだ
JIS信者のクセに慣れないUnicodeについて語るとこういった低レベルな恥ずかしい記事になる
- 717 :デフォルトの名無しさん:2017/04/01(土) 22:40:22.15 ID:7/71KzK1.net
- 濁点は独立したコードポイントを持っていても結合文字みたいなものだし、
U+30AB U+309B の場合も「ガ」と同じにみなすべきだろうね、検索の場合
- 718 :デフォルトの名無しさん:2017/04/01(土) 23:09:58.41 ID:LH/rwisT.net
- Unicode(NFKD)的には
「ガ」=「ガ」≠「カ゛」=「カ ゙」
だな
- 719 :デフォルトの名無しさん:2017/04/07(金) 00:08:24.84 ID:qNFTJj2D.net
- U+10FFFFまで埋めないと死んじゃう病にでもかかってるのかね、粗製濫造してんのは
- 720 :デフォルトの名無しさん:2017/04/07(金) 16:00:25.62 ID:3NFvJvaJ.net
- まだ丸々10面分空いてるからな
- 721 :デフォルトの名無しさん:2017/04/12(水) 14:45:57.95 ID:jhOW+nqF.net
- 正規化が悪なんじゃなくて、正規化を表に出す事が悪なんだよ
パソコンを裸族で使う様なもんだ
素人にはオススメできない
- 722 :デフォルトの名無しさん:2017/04/13(木) 18:03:47.78 ID:TzW03HI9.net
- >>719
困った病気だねぇ。
埋めずに空きをたくさん残しておいた方が未来の子孫に感謝されるぞ。
多分。
- 723 :デフォルトの名無しさん:2017/04/25(火) 06:30:16.64 ID:DObvS+Kg.net
- >>712
UTF-16で使えるじゃん?UCS-2と勘違いしてる?
- 724 :デフォルトの名無しさん:2017/04/26(水) 12:16:19.33 ID:im3ukcX1.net
- そうじゃない
- 725 :デフォルトの名無しさん:2017/05/11(木) 08:21:06.84 ID:49ESVgQe.net
- 多言語制定で見えてきた課題を一挙に解決してUnicode Neueでも立ち上げたらいいのに
バグをバグのまま残さなきゃいけないなんて仕様として不健全すぎるわ
- 726 :デフォルトの名無しさん:2017/05/11(木) 22:00:06.44 ID:wyUnsmEB.net
- 何故ドイツ語
- 727 :デフォルトの名無しさん:2017/05/17(水) 12:41:42.49 ID:EJfTNRw9.net
- フォントでよく使うからね
- 728 :デフォルトの名無しさん:2017/05/20(土) 12:07:31.13 ID:GVSnCE+6.net
- ISO 10646って2月に発行フェーズ入ったのにまだ発行できてないのは
何やってんだ?
- 729 :デフォルトの名無しさん:2017/05/24(水) 16:48:47.75 ID:u+M8iI76.net
- ISO/IECの仕事が遅いのはいつものこと
- 730 :デフォルトの名無しさん:2017/05/26(金) 12:00:03.39 ID:4g2o9CtM.net
- Unicode の Core Specification の日本の元号の説明(日付)が間違ってるのはいつ修正されるんだろう?
- 731 :デフォルトの名無しさん:2017/05/26(金) 17:54:06.19 ID:RyqPFjFC.net
- >>730
知らんが参考までに説明箇所を教えて
- 732 :デフォルトの名無しさん:2017/05/26(金) 22:00:22.89 ID:mIO9asAV.net
- >>731
ttps://techracho.bpsinc.jp/chiba-junichi/2016_09_27/25490
他にもあるかもしれませんが、自分はこのページで初めて知りました。
- 733 :デフォルトの名無しさん:2017/05/27(土) 03:01:17.90 ID:V3ffhZkY.net
- >>730-732
TZを間違って読んでるだけでは?
- 734 :デフォルトの名無しさん:2017/05/27(土) 03:15:47.09 ID:hVyPua6a.net
- ヒカル TV出演「年間5億は稼ぐ勢いですね」
https://www.youtube.com/watch?v=G7qL6ftpets
第1回案件王ランキング!YouTuberで1番稼いでるのは誰だ!
https://www.youtube.com/watch?v=asF2wQ2xhjY&t=61s
ユーチューバーの儲けのカラクリを徹底検証!
https://www.youtube.com/watch?v=FUSb4erJSXE&t=504s
YouTuberになりたいのは馬鹿じゃない!YouTuberになる方法
https://www.youtube.com/watch?v=Fr0WXXZRMSQ
最高月収5000万円だとさ。年収じゃなくて「月収」な
おまえらもyoutubeに動画投稿したほうがいい
最低2年はやらないとここまではいかないだろうけど才能とアイデアと
企画力と継続力があればが大儲けできる可能性がなくもない
まだまだ他の職種に比べれば競争率は低いからオススメ
- 735 :デフォルトの名無しさん:2017/05/29(月) 19:03:28.51 ID:K4hEGofc.net
- >>733
そうじゃないけど、定義としてTZは付与すべきだね
- 736 :デフォルトの名無しさん:2017/05/31(水) 17:05:54.16 ID:uv8MtfX4.net
- TZってちんちんズルムケの略?
- 737 :デフォルトの名無しさん:2017/06/01(木) 03:44:11.18 ID:82KsO+uD.net
- time zone
- 738 :デフォルトの名無しさん:2017/06/01(木) 11:37:45.12 ID:o/dQD8LP.net
- thin skin zone
- 739 :デフォルトの名無しさん:2017/06/02(金) 21:34:26.48 ID:Hl9pjX1u.net
- TZはこれ
http://pix.iemoji.com/images/emoji/apple/ios-9/256/regional-indicator-symbol-letters-tz.png
- 740 :デフォルトの名無しさん:2017/06/03(土) 09:51:38.32 ID:LcU0sJDm.net
- 寒いからもういいよ
- 741 :デフォルトの名無しさん:2017/06/04(日) 21:55:56.10 ID:mjDwcbxw.net
- 正直旗イメージより「伊」「蘭」「仏」とかで表示してくれたほうがわかりやすい国もある
- 742 :デフォルトの名無しさん:2017/06/09(金) 22:09:35.50 ID:PK+Q1cYY.net
- WG2 N4825によると1B130〜1B16FはSmall Kana Extensionにすることにしたらしい
でもreserved forなんてやるくらいなら、使用例があるものはとっとと入れちゃえばいいのに
- 743 :デフォルトの名無しさん:2017/06/09(金) 22:31:03.58 ID:7OSi6V+4.net
- 何に使えるのかな
ちっちゃいウンコが書けるようになるぐらいしか思いつかなかった
- 744 :デフォルトの名無しさん:2017/06/10(土) 01:15:56.46 ID:g45QxHo0.net
- http://www.unicode.org/wg2/docs/n4825-pdam2chart.pdf#page=15
annotationは消さない方がいいんじゃないかな…
- 745 :デフォルトの名無しさん:2017/06/11(日) 14:49:02.11 ID:GyEdwZPX.net
- URLが2ちゃんねるアートだと?
- 746 :デフォルトの名無しさん:2017/06/21(水) 08:20:53.06 ID:GaxJdSrE.net
- Announcing The Unicode Standard, Version 10.0
http://blog.unicode.org/2017/06/announcing-unicode-standard-version-100.html
- 747 :デフォルトの名無しさん:2017/06/21(水) 10:16:00.01 ID:bqANLNSg.net
- mage
まげ
- 748 :デフォルトの名無しさん:2017/06/21(水) 12:15:04.06 ID:GUHwFNed.net
- もう月次のバージョンアップでいいからCore specificationとUCDの改版を分離してくれ
- 749 :デフォルトの名無しさん:2017/06/21(水) 16:48:48.95 ID:Rg8XGBQ1.net
- Unicode 10.0出たのね
CodeCharts.pdfが100MB超えして落とすの&開くのだるい
- 750 :デフォルトの名無しさん:2017/06/23(金) 14:19:48.92 ID:xOTwvtKW.net
- 例示字形でフォント作ってくれないかね
とりあえず表示できればいいっていう場面は意外と多いと思うんだけど
- 751 :デフォルトの名無しさん:2017/06/23(金) 14:44:56.43 ID:0OdP20aK.net
- 2byte+任意の8x64byteみたいなbitmap造ってくれないかな
- 752 :デフォルトの名無しさん:2017/06/23(金) 18:53:47.09 ID:m93LamaP.net
- >>750
Noto Fontって全部カバーしてるんじゃないの?
- 753 :デフォルトの名無しさん:2017/06/23(金) 22:22:21.49 ID:JgWE6lrM.net
- Googleはそのつもりなのかもしれないけど、実際にはカバーできてないよ
符号化済みの漢字だけで1フォントの収納限界グリフ数(65535)を超えちゃってるから
全部カバーしようと思ったら漢字フォントだけでも2つ以上に分けないといけない
それなのにNoto CJKは、PanCJKという思想で漢字だけじゃなく仮名やハングルまで
1フォントに押し込んでしまった
おかげでUnicode 10で符号化された変体仮名なんかも入れるスペースがない
- 754 :デフォルトの名無しさん:2017/06/23(金) 23:32:51.59 ID:vCpZUNAe.net
- 変体仮名がついにUnicodeに追加されたんだな。
戸籍名に変体仮名が含まれてる可能性のある世代が存命中に間に合ってよかった。
戸籍名以外でも店の看板とかに使われてる事もあって、
うなぎ屋で「うなぎ」の「な」が「ふ」の真ん中を「ち」に変えたようなの(U+1B081)
になってるのは割りと良く見かける。
- 755 :デフォルトの名無しさん:2017/06/25(日) 17:45:14.96 ID:tWAgqwx7.net
- 筆記体をそのまま活字体にしちゃうって凄いよな
ハシゴ高もそうだけど
- 756 :デフォルトの名無しさん:2017/06/25(日) 18:02:05.37 ID:gomAIGS/.net
- ひらがな
- 757 :デフォルトの名無しさん:2017/06/25(日) 22:38:53.97 ID:zF3XL20Z.net
- Unicodeに変体仮名が追加されても、使えるのはUnicode文書の中だけで
戸籍に使えるかは別
- 758 :デフォルトの名無しさん:2017/06/26(月) 00:33:59.69 ID:fDlZrHxT.net
- とりあえずTwitterできもい絵文字の部品として使われることになるだろう
- 759 :デフォルトの名無しさん:2017/06/26(月) 02:51:52.22 ID:rSD39/hr.net
- テスト
👲👲🏻👲🏼👲🏽👲🏾👲🏿
- 760 :デフォルトの名無しさん:2017/06/26(月) 03:23:15.72 ID:gnk9fC9R.net
- 白黒絵文字だと昔のカルピスみたいになるな
- 761 :デフォルトの名無しさん:2017/06/26(月) 17:57:52.21 ID:sAGGquQo.net
- 変体仮名収録のフォントがOSに標準で搭載されるのはまだ先になりそうだな。
2chやツイッター等使われるのはそれからだな。
- 762 :デフォルトの名無しさん:2017/06/26(月) 21:13:39.72 ID:/feRpqyj.net
- そんな先なん?
- 763 :デフォルトの名無しさん:2017/06/26(月) 22:44:02.89 ID:WlgsC+Eb.net
- ハンドルネームに変体仮名使う人出てきそう。
- 764 :デフォルトの名無しさん:2017/06/26(月) 23:10:27.44 ID:Sqt2RVbj.net
- Winはゴシックの方は対応しそうな気がする
Macは基本的にAJ1-6にないものはスルーだろうな
- 765 :デフォルトの名無しさん:2017/06/27(火) 00:41:43.27 ID:GjRmAHNy.net
- Androidは
- 766 :デフォルトの名無しさん:2017/06/27(火) 14:32:14.63 ID:41er5Tk4.net
- スレタイに使う人はまだか
- 767 :デフォルトの名無しさん:2017/06/29(木) 19:09:37.83 ID:iu0jBoKG.net
- Android 6.0以降はNoto Sansだしすぐ対応するんじゃね
- 768 :デフォルトの名無しさん:2017/06/30(金) 23:42:15.21 ID:41SVCjyH.net
- 変体仮名には濁点や半濁点付きもあるけど、それらはやはり合成用濁点(U+3099)や半濁点(U+309A)を付けて表わせなのかな。
- 769 :デフォルトの名無しさん:2017/07/01(土) 10:27:57.00 ID:hIU8+r86.net
- http://www.unicode.org/Public/10.0.0/ucd/UnicodeData.txt
UnicodeData.txt の Decomposition_Mapping フィールドに対応が書いてないから駄目です。
- 770 :デフォルトの名無しさん:2017/07/01(土) 15:51:26.25 ID:YT5a66Js.net
- それは分解用じゃ…
- 771 :デフォルトの名無しさん:2017/07/01(土) 17:04:49.87 ID:SORKQB4S.net
- 全然違ったか、スレ汚してすまん(´・ω・`)
- 772 :デフォルトの名無しさん:2017/07/01(土) 17:19:00.11 ID:nV0voxDD.net
- Decomposition_Mappingは結合の目的も兼ねるので
むしろ「書いてないからこそ自分で結合」
- 773 :デフォルトの名無しさん:2017/07/01(土) 21:16:57.49 ID:YT5a66Js.net
- >>772
結合先ないじゃん
- 774 :デフォルトの名無しさん:2017/07/02(日) 22:35:50.76 ID:UYpoTCPe.net
- 合成先が定義されていないのでU+3099を用いて自分で結合
ではないだろうか
- 775 :デフォルトの名無しさん:2017/07/03(月) 14:09:44.66 ID:AyrgAZeL.net
- 最初からそう言ってるけど
- 776 :デフォルトの名無しさん:2017/07/05(水) 11:51:24.01 ID:Qpg00Afa.net
- このようにしてバベルの塔は進捗しております
- 777 :デフォルトの名無しさん:2017/07/06(木) 02:31:15.80 ID:VUvDmuBp.net
- 絵文字をぶっ込んできたのは、神の御業ってことか
- 778 :デフォルトの名無しさん:2017/07/12(水) 08:29:42.86 ID:pZQyr2Pt.net
- IVSとaj1、汎用の兼ね合いを聞くに、文字セットの粒度の違いって漢字に限らず全ての文字セットに共通の問題だな。
声の大きい人がいる漢字カテでしか語られないけど
- 779 :デフォルトの名無しさん:2017/07/18(火) 12:07:21.65 ID:Y15ZUQ7r.net
- アップル、年内追加の絵文字を公開--恐竜やゾンビ、シマウマも - CNET Japan
https://japan.cnet.com/article/35104330/
追加するのは良いけど、新規ばっかり注力してないで仕様バグ直す努力して欲しい
- 780 :デフォルトの名無しさん:2017/07/18(火) 19:43:33.65 ID:cVXFU6mc.net
- 顔から緑のが出てるやつ、それ普通に吐いてる絵文字だったんだな
緑だから野菜嫌いな子供みたいな意味なのかなと思ってた。
- 781 :デフォルトの名無しさん:2017/07/19(水) 22:46:24.80 ID:vMGHf8tr.net
- 「外字」という言葉、使えなくなるかな。同音異義語の差別用語を連想するから。
これからは「ユーザ定義文字」や「ベンダ定義文字」、「私用文字」、「規格外文字」とかに置き換えるべきかな。
- 782 :デフォルトの名無しさん:2017/07/19(水) 23:22:55.87 ID:Zx0RLH/I.net
- プア
- 783 :デフォルトの名無しさん:2017/07/20(木) 03:43:36.69 ID:Y+E7uZ+G.net
- >>781
外人は外人だろうになあ
- 784 :デフォルトの名無しさん:2017/07/20(木) 07:15:13.80 ID:5rqzfieT.net
- >>781
変な言葉狩りやめろ
- 785 :デフォルトの名無しさん:2017/07/20(木) 12:32:55.14 ID:IUJJzkHn.net
- 「外字」という表記はそのままで、
読みを変えて「そとじ」と言うことにしよう。
- 786 :デフォルトの名無しさん:2017/07/20(木) 17:08:30.52.net
- タト字
- 787 :デフォルトの名無しさん:2017/07/24(月) 19:30:26.36 ID:SPeDMBVA.net
- ISO 10646が「Publication date : 2017-07」になっている
そろそろ本気だす頃?
- 788 :デフォルトの名無しさん:2017/07/25(火) 23:23:42.52 ID:LLM1ZCjk.net
- 「がいじ」と聞くと昔から文字コードヲタの自分はやっぱりまず、
各ユーザがエディタで自作して定義する文字や、ベンダが空き領域に独自に定義した文字等の
規格外の文字であることを示す「外字」が思い浮かぶ。
まさか同音の差別用語が生まれるとは思わなかった。今日では2chの至る所で見かけるし。
- 789 :デフォルトの名無しさん:2017/07/26(水) 01:34:53.99 ID:NnPMbS6q.net
- 外事と外耳のこともたまには思い出してください
- 790 :デフォルトの名無しさん:2017/07/26(水) 16:57:39.21 ID:Pvb1ow9Q.net
- 外字フォント
- 791 :デフォルトの名無しさん:2017/07/26(水) 23:29:07.92 ID:ctIBmsHN.net
- 最近は外字あまり使われないよな。文字コードに無いのは画像にして貼り付ける事が多いし。
- 792 :デフォルトの名無しさん:2017/07/27(木) 04:45:21.73 ID:wpPsIhCe.net
- ガイジという言葉を知っていますか
Twitterでガイジという言葉を見かけました。
呟いていた方に聞いてみたら、大学生位の方が言っていたと。
果たして、言葉の意味を理解して使っていたのでしょうか。
ガイジとは、障害児を略した言葉です。障害児に対する、強烈な差別意識を感じさせる、悪意を持った言葉です。
この言葉を使えば、それだけで特定の人々、つまり障害を持つお子さんを差別したことになります。
障害児を略しただけだ、言葉の意味は変わらない、と言われる方もいらっしゃるかと思います。
違います。障害児は区別する言葉、ガイジは差別する言葉です。
- 793 :デフォルトの名無しさん:2017/07/27(木) 08:18:41.67 ID:c6JgQN0e.net
- どこかに区点が入っている気がした
- 794 :デフォルトの名無しさん:2017/07/27(木) 12:52:52.60 ID:OdPeHFfE.net
- >>792
違いますよ。
ここで言うガイジとは外字のことで、ウィキペディアから引用すると「特定の文字集合(文字コードなど)に含まれない文字のこと」となります。
差別はあなたの心の中にあるのです。
- 795 :デフォルトの名無しさん:2017/07/28(金) 12:48:01.85 ID:dbHFcG6T.net
- ISO/IEC 10646
前見た時はページ数
> Number of pages : 2697
だったのに今見たら
> Number of pages : 136
になってる? 何があった。
- 796 :デフォルトの名無しさん:2017/07/28(金) 17:41:21.27 ID:PaDDKq68.net
- たんなる間違いじゃないの
Unicodeコア仕様書ですら1000ページあるのに
- 797 :デフォルトの名無しさん:2017/07/28(金) 23:58:07.94 ID:g7fuxxO4.net
- 可能性を推測するならコードチャートが本文のカウントから外されたとか
- 798 :デフォルトの名無しさん:2017/07/30(日) 21:43:07.30 ID:PsllIOC5.net
- チャート本体はUnicode X.0.0を参照せよ
とかだったりして
- 799 :デフォルトの名無しさん:2017/08/02(水) 07:35:28.28 ID:ka6IexAb.net
- 架空文字(スタートレックとか)は頑なに却下するくせに、絵文字はどんどん創作して追加してるのダブスタだよな
架空文字も絵文字として申請すれば良いのか?
- 800 :デフォルトの名無しさん:2017/08/02(水) 22:31:37.76 ID:3UX7sSkR.net
- ピカチュウとか申請したらドサクサに紛れていつの間にか入ってそう
- 801 :デフォルトの名無しさん:2017/08/03(木) 07:42:40.67 ID:DjKC+R0J.net
- >>799
フィクションの文字はそうしちゃえばいいね
- 802 :デフォルトの名無しさん:2017/08/05(土) 08:17:17.76 ID:de8G3D2Z.net
- Kangaroo, Softball, Frowning Poo Emojis Possible For 2018
http://blog.emojipedia.org/kangaroo-softball-frowning-poo-emojis-possible-for-2018/
- 803 :デフォルトの名無しさん:2017/08/05(土) 09:23:06.46 ID:o5e6vDfw.net
- ウンコが増えるよ!やったね!
- 804 :デフォルトの名無しさん:2017/08/05(土) 11:54:11.90 ID:WO/v0A2W.net
- はよう糞まみれになろうや
- 805 :デフォルトの名無しさん:2017/08/05(土) 16:21:53.87 ID:NtivcnXJ.net
- 世界中の文字セットを1つに扱うのが目的であって、新しい文字を創作するのはおかしいのにね
- 806 :デフォルトの名無しさん:2017/08/06(日) 09:56:20.49 ID:qWN01ODb.net
- >>800
ポケモン約800種類全てを全国図鑑番号順に割り当てられたりして。
♂♀の選択やフォルムチェンジはVSのような専用の符号を後ろに付けるとかで。
- 807 :デフォルトの名無しさん:2017/08/06(日) 10:19:15.27 ID:sla8IrYb.net
- 人の肌の色に対応するんだったら馬の毛色にも対応してほしい。
青毛、鹿毛、栗毛、芦毛とか。
- 808 :デフォルトの名無しさん:2017/08/06(日) 19:19:25.07 ID:q/iOXjTE.net
- ピカチュウ入れたら
「ドラクエのスライム入れろ」「FFのチョコボ入れろ」「マリオ入れろ」
とかになっちゃうがな。
- 809 :デフォルトの名無しさん:2017/08/06(日) 23:08:06.45 ID:MiLcYytM.net
- いずれ世界中の民族衣装が採用されるんじゃまいか?
- 810 :デフォルトの名無しさん:2017/08/07(月) 12:31:51.02 ID:eqFqtwmF.net
- >>808
キャラクターや商標やら他の権利で守られてるものは無理でしょ
- 811 :デフォルトの名無しさん:2017/08/07(月) 12:32:30.82 ID:eqFqtwmF.net
- >>807
確かにな
動物系は
- 812 :デフォルトの名無しさん:2017/08/07(月) 13:23:43.13 ID:9Mdxb5QD.net
- 絵文字は日本のケータイで使われていてベンダ間で
交換もされてたから入ったわけで、ポケモン等は意味不明
- 813 :デフォルトの名無しさん:2017/08/08(火) 20:54:41.14 ID:PndXgq1K.net
- >>812
今や携帯由来の絵文字は極少数
Unicode独自定義の絵文字ばかりになった
法的な問題がクリアできれば需要はある
- 814 :デフォルトの名無しさん:2017/08/09(水) 11:28:24.84 ID:q+cnFBMg.net
- あああ、もうめちゃくちゃだよ…
- 815 :デフォルトの名無しさん:2017/08/09(水) 18:15:40.27 ID:5nByh/9q.net
- ピカチュウは
U+1F401 U+200D U+26A1(鼠、マウスの絵文字 + ZWJ + 高電圧、雷マーク)
で表す事にしよう。
- 816 :デフォルトの名無しさん:2017/08/09(水) 22:53:31.39 ID:bp2xq1i0.net
- emojiがエジプト神聖文字のように言語化しつつある。
- 817 :デフォルトの名無しさん:2017/08/09(水) 23:10:01.92 ID:d92boKtE.net
- >>807
サバトラとかキジトラ白とか三毛とか
- 818 :デフォルトの名無しさん:2017/08/10(木) 15:51:43.81 ID:/ua5Aw52.net
- 現代の象形文字、それがEmoji。
- 819 :デフォルトの名無しさん:2017/08/10(木) 22:08:34.52 ID:PKHYBccj.net
- >>815
ライチュウとかピチューとか区別できる?
- 820 :デフォルトの名無しさん:2017/08/10(木) 22:58:47.89 ID:/XWrshI+.net
- >>817
日本が提案してた
ケーキ+汎用の色セレクタ=チョコレートケーキ
案を復活させるべきだな
- 821 :デフォルトの名無しさん:2017/08/16(水) 06:18:57.16 ID:HvWTm0rv.net
- 上に何載せるかをセレクタにすべきだな
- 822 :デフォルトの名無しさん:2017/08/17(木) 14:19:45.83 ID:vMvhQSc5.net
- 上にのせるものは結合文字でいい
幾つでものせてよし
もちろんホイップにイチゴは合成済み文字で
- 823 :デフォルトの名無しさん:2017/08/17(木) 18:03:41.72 ID:NZeYtWs8.net
- >>822
真に受けんなよ
- 824 :デフォルトの名無しさん:2017/08/18(金) 12:09:15.45 ID:FcTfUvNw.net
- Jアラート訓練 メール電文が文字化けのトラブル
8月18日 11時51分
島根県で行われたJアラート=全国瞬時警報システムを使用した緊急情報の送受信訓練で、県の防災メールでテスト電文が配信されましたが、画面が文字化けして読めないというトラブルがありました。
島根県によりますと、防災メールにはおよそ1万5000人が登録しているということですが、どの程度の範囲で文字化けが起きたのかなど詳しい状況について確認を進めているということです。
島根県防災危機管理課は「きちんと情報が伝達できずに申し訳ない。現在、原因の究明を進めていて、今後こうしたことが起きないように努めたい」と話しています。
http://www3.nhk.or.jp/news/html/20170818/k10011103391000.html
- 825 :デフォルトの名無しさん:2017/08/18(金) 12:25:20.77 ID:eIpnBeVf.net
- MIMEエンコしてないとか
- 826 :デフォルトの名無しさん:2017/08/18(金) 12:42:20.53 ID:FcTfUvNw.net
- 文字化けメール画像
http://www3.nhk.or.jp/news/html/20170818/K10011103391_1708181154_1708181155_01_02.jpg
- 827 :デフォルトの名無しさん:2017/08/18(金) 16:02:13.46 ID:eIpnBeVf.net
- どうせrubyωで作ったとか
- 828 :デフォルトの名無しさん:2017/08/18(金) 16:20:36.62 ID:RRX5RBja.net
- >>826 を見るとこんな感じに化けてる
$ echo '2017年08月' | iconv -f SJIS -t UTF-8
2017蟷エ08譛
つまり、メール送信システムはSJISのテキストを受理するように作られていて
誤ってUTF-8のテキストを入れてしまった。ってことかな
- 829 :デフォルトの名無しさん:2017/08/18(金) 16:28:58.20 ID:f8KfeV+E.net
- 「即時音声合成」
2017年08月18日11時00分
これは、Jアラートのテストです。
これで、テストを終了します。
対象地域:
鳥取県 島根県 岡山県 広島県 山口県 徳島県 香川県 愛媛県 高知県
↓
縲悟叉譎る浹螢ー蜷域・縲・
2017蟷エ08譛・8譌・11譎・0蛻・
縺薙l縺ッ縲゛繧「繝ゥ繝シ繝医・繝・せ繝医〒縺吶ゅ
縺薙l縺ァ縲√ユ繧ケ繝医r邨ゆコ・@縺セ縺吶ょ
蟇セ雎。蝨ー蝓滂シ夐
魑・蜿也恁縲蟲カ譬ケ逵後蟯。螻ア逵後蠎・ウカ逵後螻ア蜿」逵後蠕ウ蟲カ逵後鬥吝キ晉恁縲諢帛ェ帷恁縲鬮倡衍逵啓
か。
ヘッダとフッタが正常なのが泣ける
- 830 :デフォルトの名無しさん:2017/08/18(金) 17:06:27.71 ID:eIpnBeVf.net
- iconvなんか使うなよ
- 831 :デフォルトの名無しさん:2017/08/19(土) 04:28:22.39 ID:8wK5LPmg.net
- このスレに一般ニュースがかかわってくるとは珍しい
- 832 :デフォルトの名無しさん:2017/08/19(土) 15:21:07.32 ID:vQyZjPpv.net
- 島根クオリティのruby
- 833 :デフォルトの名無しさん:2017/08/19(土) 21:29:17.88 ID:PoJOAggC.net
- ruby漏れの
- 834 :デフォルトの名無しさん:2017/09/01(金) 18:44:22.34 ID:kgVPWxeV.net
- Unicode絵文字はどうなるんだろうね
- 835 :デフォルトの名無しさん:2017/09/02(土) 00:16:19.15 ID:jUAASW0y.net
- 絵文字はアラートにいるだろうか
- 836 :デフォルトの名無しさん:2017/09/05(火) 23:47:25.10 ID:CxjNlFkm.net
- 花園明朝バージョンアップ来た。
漢字拡張Fや変体仮名が追加されてた。
- 837 :デフォルトの名無しさん:2017/09/13(水) 20:02:44.61 ID:KWwY7/kL.net
- iPhoneXで動く絵文字Animojiまで出てきた
最初からUnicodeとは別の仕様作ってバリバリ仕様改変していけば良かったのにな
- 838 :デフォルトの名無しさん:2017/09/13(水) 23:58:47.08 ID:i8DgB3mu.net
- IPAmj明朝はバージョンアップまだかな?
変体仮名が内部に含まれてるけどこのままじゃ使えない。
cmapテーブル改変すりゃ使えるけど公式で使えるようになるのはいつになるかな。
- 839 :デフォルトの名無しさん:2017/09/14(木) 20:00:42.99 ID:olxB6Qiw.net
- Japan New Era Name Support Blog – 日本マイクロソフトの新元号 (和暦) 対応に関するサポート情報のブログです
https://blogs.technet.microsoft.com/jperablog/
こんなん作ってたのかマイクロソフト
- 840 :デフォルトの名無しさん:2017/09/15(金) 22:07:07.01 ID:Eknhu6BK.net
- MS自身が符号化提案するつもりなのかな
場所はどこになるんだろう
- 841 :デフォルトの名無しさん:2017/09/17(日) 07:56:28.63 ID:mseaw4po.net
- 新しい文字コード作るのか?
- 842 :デフォルトの名無しさん:2017/09/17(日) 17:45:38.08 ID:HcLQ0vfz.net
- 色々考えてんね
- 843 :デフォルトの名無しさん:2017/09/17(日) 18:23:49.36 ID:PNbDpzbo.net
- UTF-1Mとかはどうよ?
1文字1Mbyteで1024x1024のビットイメージで1文字を現す。
- 844 :デフォルトの名無しさん:2017/09/17(日) 22:48:01.62 ID:bCKL0uvM.net
- Shift_JIS/CP932にも追加するんだろうか新元号
- 845 :デフォルトの名無しさん:2017/09/17(日) 23:39:25.78 ID:f8iJT+1F.net
- Unicodeは組文字指示子でも作れよ
- 846 :デフォルトの名無しさん:2017/09/18(月) 07:57:38.05 ID:Q2/IYiwb.net
- CP932の元号ってなんでつながってないの?
- 847 :デフォルトの名無しさん:2017/09/18(月) 11:14:04.62 ID:pqj5nFKY.net
- 1文字目+ZWJ+2文字目でいいやん。
- 848 :デフォルトの名無しさん:2017/09/18(月) 14:47:22.52 ID:/S27bRBH.net
- >>846
予め空けておくのは不敬罪
- 849 :デフォルトの名無しさん:2017/09/18(月) 16:48:59.00 ID:ygz3rI3S.net
- >>846
後付けだからでは
いわゆるNEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはずで
その頃は当然まだ昭和で平成は影も形もない
「~」が13区63点に入った理由もよく知らないけど一番外字で埋められてなさそうな端っこにしたとかだろうか
- 850 :デフォルトの名無しさん:2017/09/18(月) 22:35:48.18 ID:w6oSciVB.net
- >NEC特殊文字というのがいつ出来たか詳しく知らないけど1983年頃には使えたはず
そんな本当のことを言うと、NEC特殊文字が1997年の
Shift_JISの拡張と妄信してる先生の世界に矛盾が生じてしまうだろ
- 851 :デフォルトの名無しさん:2017/09/19(火) 01:31:34.53 ID:bjGHvQqi.net
- シフト符号化といわゆるShift-JISを混同すんな
- 852 :デフォルトの名無しさん:2017/09/19(火) 03:05:46.20 ID:qsNfDhHd.net
- MSゴシック/MS明朝/メイリオとIPAって、
~は縦書きグリフでも横に並べたままなのね。
実際の使用現場では縦横どっちのほうが便利なんだろ。
- 853 :デフォルトの名無しさん:2017/09/19(火) 05:07:32.07 ID:33S+M35U.net
- 手元のフォントだと、~だと縦になるフォントと横のままのフォント両方あるけど、iとかは全部縦になる
ってことはデザイナーが意図して横のままにしてるんだろうな
- 854 :デフォルトの名無しさん:2017/09/19(火) 15:42:33.57 ID:k8wd+zqV.net
- >>852
使わないのが定石
そう言う問題以前にフォントとして使い辛い
- 855 :デフォルトの名無しさん:2017/09/20(水) 03:22:20.33 ID:LjqpwHID.net
- 使わないなら誰のために追加するんや…
- 856 :デフォルトの名無しさん:2017/09/20(水) 07:30:00.77 ID:YPFC/x+p.net
- とりあえずPCで表示できればいいやっていう需要に応えるため
- 857 :デフォルトの名無しさん:2017/09/20(水) 07:34:34.62 ID:ZYEvUxiN.net
- InDesignやIllustratorの縦中横機能を使えない一般ピーポーのための“貧者の縦中横”じゃないの?
- 858 :デフォルトの名無しさん:2017/09/22(金) 18:32:09.05 ID:QCzCo6Xh.net
- そのアホと仕様化メンバーのアホがコラボしてUnicodeの属性がむちゃくちゃになったからな
- 859 :デフォルトの名無しさん:2017/09/26(火) 23:12:20.44 ID:ZBZ84yRG.net
- Unicodeが独断で絵文字を追加して、SC2/WG2の投票を通さず勝手にUnicodeチャートを
アップデートしてることにアイルランドNBから文句がついた(WG2 N4888)
- 860 :デフォルトの名無しさん:2017/09/27(水) 01:58:12.86 ID:QltraNmZ.net
- そんなことしてたのか。
- 861 :デフォルトの名無しさん:2017/09/27(水) 22:27:48.19 ID:CfAOIjZ1.net
- アイルランド代表ってファックサインとバルカン式挨拶の絵文字入れた件の印象しか無いな
真面目?な仕事もしてるんだなさすがに
- 862 :デフォルトの名無しさん:2017/09/27(水) 22:55:01.58 ID:PWLdOFze.net
- もう一生Unicodeなのかな…
- 863 :デフォルトの名無しさん:2017/09/28(木) 01:10:46.04 ID:/8a1xhL4.net
- Unicodeの代わりになる何かができたとして、
それには確実にUnicode互換文字がずらりと入っているはずだから一生Unicodeみたいなもんだ。
- 864 :デフォルトの名無しさん:2017/09/28(木) 02:44:35.32 ID:VjJJSlDU.net
- >>862
俺は死ぬまでSJISと付き合うんだろうなあと思う。
- 865 :デフォルトの名無しさん:2017/09/28(木) 10:29:24.48 ID:PJxaABWy.net
- 朝鮮クオリティ
- 866 :デフォルトの名無しさん:2017/09/28(木) 11:41:48.77 ID:A+i/ub4B.net
- 大抵の人間はutf8で満足なんじゃないの?
- 867 :デフォルトの名無しさん:2017/09/28(木) 18:50:29.30 ID:L3o6siGJ.net
- Unicodeで良いと思っちゃうんだよな
もし叶うならCJK周りを最適化したいね
- 868 :デフォルトの名無しさん:2017/09/28(木) 19:38:34.40 ID:yupWamhN.net
- 宇宙人との交信が普通になってくるとまたいろいろもめそう
- 869 :デフォルトの名無しさん:2017/09/28(木) 23:51:52.20 ID:XJXTBf+J.net
- 肌色セレクタを増やさないといけないからな
- 870 :デフォルトの名無しさん:2017/09/29(金) 18:58:48.01 ID:P52gO+TE.net
- >>859の結果
http://www.unicode.org/wg2/docs/n4903-ProcessAdHocReport.pdf
shouldなんで表現としては弱めな気もするけど、UTC議長のLisa Mooreも
同席してるから今後はUTCも好き勝手にはできないかも
- 871 :デフォルトの名無しさん:2017/09/30(土) 02:49:12.29 ID:R0O9XLNW.net
- Adobeは新グリフセットAdobe-KRを作ることにした模様
いつになったらAJ1-7に取り掛かるんだ…
- 872 :デフォルトの名無しさん:2017/10/01(日) 23:26:06.97 ID:0lGqZVhk.net
- >>869
そもそも顔絵文字なんかは表情を記号化したものであって特定の人種を表現したものではない
差別がなかったところにあえて差別を持ち込んで差別をなくす方法論を議論する事自体おかしい
特定の人種の特徴を持たせたいなら書体と同様にフォントなどでフォローすべき
- 873 :デフォルトの名無しさん:2017/10/02(月) 02:39:27.88 ID:791wgfKq.net
- レゴも昔はそういう感じで全部黄色い人だったけど、
いつの間にかリアル人種に合わせた色がたくさん出るようになってしまった
- 874 :デフォルトの名無しさん:2017/10/04(水) 22:07:29.50 ID:VRsAqAhr.net
- 世相を反映するUnicode
- 875 :デフォルトの名無しさん:2017/10/05(木) 08:20:09.15 ID:puXRBXzi.net
- >>872
フェイスマーク系が全部黒人の絵文字のフォントがあったとしても仕様満たしてるしな
そのうち「絵文字では皮膚色選べるんだから通常文字に文字色選択子が必要」っていう逆の発想が出てきそう
- 876 :デフォルトの名無しさん:2017/10/06(金) 21:44:06.11 ID:EeCF6Ukp.net
- なぜかPDAM2.2(n4904)から小書き"こ"が消えてるなあと思ったら
どうも日本NBが小書きのかな全般に文句つけたのが原因みたい(n4871)
調査するから一旦投票から外してほしいってことらしいが、コードポイントが
五十音順になるようreserveされてるんだから、順次追加していくのでも
問題ないだろうに日本NBは何が不満なんだか
- 877 :デフォルトの名無しさん:2017/10/06(金) 23:21:55.38 ID:FuaeRY5L.net
- 場合によってはそもそも作ってほしくないんじゃないの
- 878 :デフォルトの名無しさん:2017/10/07(土) 20:47:59.42 ID:8fNRGep5.net
- Amazonによるミニスーファミキャンセル騒動 - Togetterまとめ
https://togetter.com/li/1158390
豪快に文字化けワラタ
罫線ぽいのが混ざってるからCP437かな?
- 879 :デフォルトの名無しさん:2017/10/08(日) 21:40:08.74 ID:BAjE4UNz.net
- ガセかと思ったけどマジなんか
なんで誰も気付かなかったし
- 880 :デフォルトの名無しさん:2017/10/13(金) 23:48:07.78 ID:K2R51jFQ.net
- 伝票番号に予め配達の営業所までのデータ入っててバーコード読めりゃ営業所までスルーって事かな
>>878
これ勝手に転載してるんだろうがデコードできりゃ問題だよなあ…
- 881 :デフォルトの名無しさん:2017/10/14(土) 10:57:44.21 ID:RYv3j8m+.net
- ISO 10646:2014って開発失敗したんか?
もう出ないよな?
- 882 :デフォルトの名無しさん:2017/10/14(土) 14:53:48.95 ID:TG6KQnkb.net
- >>880
>デコード
たしかに
やってみてくれ
- 883 :デフォルトの名無しさん:2017/10/15(日) 20:24:02.01 ID:wfF3NLsX.net
- >>881
Publication date : 2017-07
ってなってるんだし規格は完成してるのでは
サイトの更新が遅いだけじゃないの?
- 884 :デフォルトの名無しさん:2017/10/18(水) 00:36:08.65 ID:XwII08/d.net
- 2014出てるよ
http://standards.iso.org/ittf/PubliclyAvailableStandards/index.html
http://www.iso.org/standard/63182.html
もしdkuugが更新されていないことを見て言ってるならそこはもう放棄されてる
- 885 :デフォルトの名無しさん:2017/10/24(火) 14:09:16.76 ID:Jp5ETl7F.net
- 俺たちのEMOJIの実力を思い知れ
https://twitter.com/lavrton/status/922630292052967424
- 886 :デフォルトの名無しさん:2017/10/24(火) 20:04:59.52 ID:i5hhptUR.net
- 何で親子2人ずつの核家族なんだ
地域によっては大家族のサポートも求められるが
組み合わせ違いのグリフ全部作っていくのは天文学的になりそう
- 887 :デフォルトの名無しさん:2017/10/25(水) 18:01:51.97 ID:TxCrr8Dz.net
- 絵文字じゃなくて絵と解釈してるから混乱する
そういう奴らからのツッコミポイントなくした絵文字作ればいいけど、現状は屈してバリエーション作っちゃうんだよな
- 888 :デフォルトの名無しさん:2017/10/25(水) 18:14:16.54 ID:NxsNik2t.net
- 頭悪そう
- 889 :デフォルトの名無しさん:2017/10/25(水) 18:14:50.88 ID:byKDMVHo.net
- だって例示図形が絵なんだもん
絵ではないと考えてほしかったのなら例示図形をもっと抽象的にするか、
あるいは例示さえせずに (マンガのようなおおげさなウンコ) みたいに言語表現にするべきだったな
- 890 :デフォルトの名無しさん:2017/10/25(水) 18:41:48.33 ID:sAsgJLsM.net
- カラーの時点で絵ではないは無理がある
絵ではないなら色は他のテキスト同様にテキストカラー使えよ
- 891 :デフォルトの名無しさん:2017/10/30(月) 18:00:33.61 ID:ZnP3Ol2c.net
- >>890
カラーは実装依存だぞ
基本は白黒
- 892 :デフォルトの名無しさん:2017/10/30(月) 18:57:12.83 ID:KZpAr8Yx.net
- >>891
色指定IVSはなんなんだ
- 893 :デフォルトの名無しさん:2017/10/31(火) 12:58:58.32 ID:KJARTkQB.net
- 色というより肌色(=人種)のセレクタじゃないの?
- 894 :デフォルトの名無しさん:2017/10/31(火) 14:17:24.66 ID:MybAfan2.net
- EMOJIはどこに向かおうとしているのか
How Do You Like Your Burger Emoji?
https://blog.emojipedia.org/how-do-you-like-your-burger-emoji/
- 895 :デフォルトの名無しさん:2017/11/02(木) 00:11:17.70 ID:BZDz7XTE.net
- 具オーダーセレクターが誕生するフラグか
- 896 :デフォルトの名無しさん:2017/11/02(木) 04:52:42.22 ID:S5CQdMtg.net
- 人工乳房の形成に常滑焼の鋳型が新技術に貢献(NHK)
- 897 :デフォルトの名無しさん:2017/11/02(木) 22:59:50.35 ID:4h9B4mO8.net
- ハンバーガーオーダーセレクタに使えそうなのは
U+1F345 TOMATO
U+1F952 CUCUMBER (PICKLE)
くらい?
最低でもバンズ、ハンバーグ、チーズ、レタスは登録しないとな。
- 898 :デフォルトの名無しさん:2017/11/03(金) 01:17:50.06 ID:6SzVRupm.net
- フライドポテトとスマイルはすでに単独でオーダーできるな
- 899 :デフォルトの名無しさん:2017/11/03(金) 16:09:36.09 ID:rOBRj+Zt.net
- 一部以外、元々人種・ジェンダーレスの文字だったのに声の大きい人達のせいで見せかけの平等を捻じ込まれてホント嫌悪感しかないわ
- 900 :デフォルトの名無しさん:2017/11/03(金) 20:20:46.51 ID:HuwGCmuD.net
- うむ
- 901 :デフォルトの名無しさん:2017/11/04(土) 16:12:16.61 ID:hsDfLASV.net
- >>899
そうやって仕様がめちゃくちゃになっていくんだろうな
- 902 :デフォルトの名無しさん:2017/11/04(土) 21:28:22.44 ID:NJtYjjHJ.net
- そもそも今までどこにも使われていなかった「文字」を創り始めた時点でもう
- 903 :デフォルトの名無しさん:2017/11/06(月) 08:58:06.05 ID:jmQIkdel.net
- Google makes the "Android Burger" a reality for its employees
https://www.neowin.net/news/google-makes-the-android-burger-a-reality-for-its-employees
- 904 :デフォルトの名無しさん:2017/11/06(月) 16:14:18.07 ID:Oz+5QplX.net
- 現実のほうで辻褄を合わせていくスタイル
- 905 :デフォルトの名無しさん:2017/11/08(水) 21:11:00.50 ID:OtipW7Ea.net
- うんこ絵文字追加提案に異議あり
https://srad.jp/story/17/11/08/0528217/
- 906 :デフォルトの名無しさん:2017/11/08(水) 21:44:31.71 ID:7S3fHwbe.net
- それよりも1F3E2 OFFICE BUILDINGとZWJでつなげてSHITAMACHIを表現したい
- 907 :デフォルトの名無しさん:2017/11/08(水) 23:35:22.51 ID:3K3ujviI.net
- uncode
- 908 :デフォルトの名無しさん:2017/11/09(木) 09:24:07.69 ID:UInw5/Yz.net
- これを貼れと言われた気がするので
ttp://cdn-ak.f.st-hatena.com/images/fotolife/n/noir555/20120325/20120325193503.jpg
- 909 :デフォルトの名無しさん:2017/11/09(木) 21:26:42.48 ID:p3pQfTpt.net
- 方角からして裏のマンションはうんこに日が沈むのか
- 910 :デフォルトの名無しさん:2017/11/11(土) 10:21:56.51 ID:6gNjPSTt.net
- すばらしい
- 911 :デフォルトの名無しさん:2017/11/12(日) 01:32:45.14 ID:H7C5gFJ5.net
- >>908
浅草だよね?
しかも左から2つ目は墨田タワーか?
そういう位置関係なのか。
- 912 :デフォルトの名無しさん:2017/11/12(日) 08:41:00.21 ID:e5xLDhIK.net
- 全てがウンコ色に輝いている。
すばらしい。
- 913 :デフォルトの名無しさん:2017/11/14(火) 20:01:47.04 ID:rcEwUB0d.net
- こんじきうんこ
- 914 :デフォルトの名無しさん:2017/11/22(水) 16:48:22.55 ID:g+mfhWNq.net
- Unicode 10.0 の仕様読んでて思ったんだけど
Core Specification のCJK統合漢字の数字、間違ってない?
20,902+69+6,582+42,711+4,149+222+5,762+7,473+1,014
= 88,884
にしかならないんだけど……。
仕様の合計↓では 88,932 らしいんだが。その差48、何だそれ。
The Unicode® Standard
Version 10.0 – Core Specification
Appendix D
Version History of the Standard
http://www.unicode.org/versions/Unicode10.0.0/appD.pdf#page=6
- 915 :デフォルトの名無しさん:2017/11/22(水) 16:52:42.86 ID:TZAtmSaI.net
- win10
IME で 「こっき」 って変換すると
☪☭☫✡
日の丸出てこないぞ
- 916 :デフォルトの名無しさん:2017/11/22(水) 17:44:22.62 ID:gB9u/pWI.net
- ってかその4つこっきか?
- 917 :デフォルトの名無しさん:2017/11/23(木) 10:17:38.60 ID:h7MW0ffb.net
- >>915
IME捨てろ
- 918 :デフォルトの名無しさん:2017/11/23(木) 12:20:50.57 ID:eO5S+uX/.net
- >>916
トルコ、ソ連、イラン、イスラエルか?
- 919 :デフォルトの名無しさん:2017/11/23(木) 22:58:49.58 ID:stYe0Oux.net
- ISO/IEC 10646 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
Publication date : 2017-12
Number of pages : 2693
に更新されてた。
- 920 :デフォルトの名無しさん:2017/11/24(金) 00:48:54.85 ID:O5myFoBo.net
- >>918
●●●★
日本、パラオ、バングラ、越南
- 921 :デフォルトの名無しさん:2017/11/25(土) 15:25:35.45 ID:unmm6CwQ.net
- チョンも入れたれ
- 922 :デフォルトの名無しさん:2017/11/27(月) 00:57:53.51 ID:NURIqS8t.net
- >>921
おまえは他所行ってな
- 923 :デフォルトの名無しさん:2017/11/29(水) 14:53:47.04 ID:UhXC0KGu.net
- Googleのハンバーガー絵文字、Android 8.1でチーズの位置を修正
http://www.itmedia.co.jp/news/articles/1711/29/news078.html
- 924 :デフォルトの名無しさん:2017/11/29(水) 23:06:09.33 ID:CvPoQMbr.net
- 🍔食べたい
- 925 :デフォルトの名無しさん:2017/11/29(水) 23:54:56.29 ID:tk9E5aVC.net
- なんで最近はハンバーガー押したらメニューが出てくるんだ
メニューから注文するんだから順序が逆じゃないか
- 926 :デフォルトの名無しさん:2017/12/06(水) 08:48:45.84 ID:6rXadv4l.net
- ユニコードコンソーシアム、来年に追加予定の新しい絵文字の最新の候補リストを公開
ttps://taisy0.com/2017/12/06/89650.html
- 927 :デフォルトの名無しさん:2017/12/06(水) 10:23:15.11 ID:LlbO+WJR.net
- もういいっ、もう休めっ
- 928 :デフォルトの名無しさん:2017/12/06(水) 14:03:58.50 ID:TJabUNNS.net
- 昔はUnicodeへの絵文字導入はガラパゴス国のデンワへの後方互換性のため仕方なくやってくれたんだと思ってました
ほんとは自分のおもちゃがほしかったんですね…
- 929 :デフォルトの名無しさん:2017/12/06(水) 17:30:16.47 ID:oBvdSzU/.net
- これはひどい
- 930 :デフォルトの名無しさん:2017/12/07(木) 05:23:32.91 ID:4IlO+z0O.net
- もう認識が絵文字じゃなくて絵だよね
- 931 :デフォルトの名無しさん:2017/12/07(木) 08:08:48.43 ID:jxDfrp/1.net
- 悲しいウンチは候補リストからはずされたのか。
- 932 :デフォルトの名無しさん:2017/12/07(木) 14:11:28.75 ID:U5wmuQTN.net
- ある意味今の状況を一番表している絵だったのに
- 933 :デフォルトの名無しさん:2017/12/08(金) 13:03:34.59 ID:0lzANth5.net
- ホント糞だな
- 934 :デフォルトの名無しさん:2017/12/08(金) 13:40:05.51 ID:6WtIjESa.net
- >>931-932
他の物を通すための囮だったかもな
- 935 :デフォルトの名無しさん:2017/12/15(金) 12:23:55.99 ID:Mjdx4Jdk.net
- No20のカップケーキがだいぶうんち
- 936 :デフォルトの名無しさん:2017/12/21(木) 22:04:29.07 ID:Pje/kUoS.net
- ISO/IEC 10646:2017 - Information technology -- Universal Coded Character Set (UCS)
https://www.iso.org/standard/69119.html
やっと Published になった。
最初2016だったのが2017になったけど2018になるのはギリギリ避けられたか。
- 937 :デフォルトの名無しさん:2017/12/22(金) 15:14:29.35 ID:exw3lv6k.net
- Android民「iPhone民から♂♀とか性別のアピールが送られてくるのはなぜ?」「流行りかと思った」
https://togetter.com/li/1182276
- 938 :デフォルトの名無しさん:2017/12/22(金) 16:48:24.80 ID:5h4hYzog.net
- L2/17-429
Request to reserve the code point for square Japanese new era name (SC2 N4577)
Japan NB
2017-12-18
http://www.unicode.org/L2/L2017/17429-sc2-n4577-japan-new-era.pdf
"We noticed some legacy solutions still only support BMP."が泣ける。
- 939 :デフォルトの名無しさん:2017/12/23(土) 00:06:09.91 ID:fYRtLYYp.net
- https://twitter.com/luka_tarot/status/943831841420713984
仕事関係の方からのメール、時々うんこマークの絵文字(これ→💩)が付いてくるので1年くらいモヤモヤしてやました。
今日初めてググってみたら、DOCOMOからSOFT BANKにメールを送ると、音符マークがうんこに変換されるようです…‼
︎ DOCOMOの方、音符の絵文字にはくれぐれもご注意くださいね
- 940 :デフォルトの名無しさん:2017/12/23(土) 17:51:33.27 ID:tY6TFHQG.net
- 禿の嫌がらせωω
- 941 :デフォルトの名無しさん:2017/12/24(日) 20:51:23.00 ID:fAY4pJin.net
- コンピューターで全漢字使用可に 6万字コード化
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html
- 942 :デフォルトの名無しさん:2017/12/24(日) 21:03:24.97 ID:czMQ2Cnw.net
- 文字情報基盤の追加IVD登録と変体仮名の入った10646が出たことをもって
「完了した」ってことかな
- 943 :デフォルトの名無しさん:2017/12/24(日) 22:27:08.09 ID:G1OevDef.net
- つちよしって2001年のCJK統合漢字拡張Bから使えるのでは……(U+20BB7)
Jソースが無いから日本の漢字じゃないとかそういう話?
- 944 :デフォルトの名無しさん:2017/12/25(月) 14:28:26.87 ID:vAchG11E.net
- マスゴミ記者が間に入ると情報が可笑しくなる例
- 945 :デフォルトの名無しさん:2017/12/25(月) 16:08:58.35 ID:PLr6J7k5.net
- プレス発表 「文字情報基盤整備事業」で推進していた漢字6万文字の国際規格化が完了:IPA 独立行政法人 情報処理推進機構
https://www.ipa.go.jp/about/press/20171225.html
>>941のIPA発表
- 946 :デフォルトの名無しさん:2017/12/25(月) 16:39:31.09 ID:od7irzxW.net
- マイナ開始する前に完了させとけよ
- 947 :デフォルトの名無しさん:2017/12/25(月) 21:26:50.34 ID:bsx5SElH.net
- PCで扱える漢字 6万文字に
http://www.itmedia.co.jp/news/articles/1712/25/news071.html
- 948 :デフォルトの名無しさん:2017/12/25(月) 22:01:22.03 ID:QOFkYfoX.net
- itmediaのこの見出しはアウトだな
- 949 :デフォルトの名無しさん:2017/12/26(火) 06:17:01.01 ID:HWfT7fYR.net
- >>942
それを知らない人に伝えるにはこう言うしかないかもね
- 950 :デフォルトの名無しさん:2017/12/27(水) 15:43:36.55 ID:RCW7nLI3.net
- サヨク並みにアホ
- 951 :デフォルトの名無しさん:2017/12/27(水) 18:58:01.47 ID:pTOpkpNU.net
- >>937
人の絵文字+ZWJ+性別
形式にしたのは対応してない環境でも最低限の意味は伝えられるだろうという配慮なのかね?
これ見る限り全く理解されてないのが悲しいが
- 952 :デフォルトの名無しさん:2017/12/27(水) 21:38:26.15 ID:K+2IikmJ.net
- >>951
勝手に誤解して悲しがってるあなたのほうが悲しいが
- 953 :デフォルトの名無しさん:2017/12/28(木) 00:39:28.23 ID:ieNYico0.net
- 存在自体が見えないZWJじゃなくて
非対応の組み合わせでは+マークを表示するルールの新結合文字作ったほうがよかったんじゃないかね
- 954 :デフォルトの名無しさん:2017/12/30(土) 18:56:44.40 ID:Ugth+Qnu.net
- 漢字6万字て、馬鹿か。
取るに足りない些細な違いをもって同じ文字と認めない。
最う駄目だ。
- 955 :デフォルトの名無しさん:2017/12/30(土) 23:54:24.56 ID:8RkbD7fK.net
- >945
まあ、異字体を丹念に拾ってくれるのはありがたいけれど、
漢文をTeXで扱う場合に、Adobe Japan 1-5(20313字)にない
文字が時々出てくる(例えば『列子』など)時など、IPAMJに
その文字があると、助かる。
出来れば、中国の古典籍に出てくる文字を積極的に
IPAMJに収録するようにしてもらいたいとおもっている。
もっとも、戸籍用の文字を収録することは、行政上から
いえば、最優先事項であることは理解できるのだが。
- 956 :デフォルトの名無しさん:2017/12/31(日) 10:25:58.42 ID:rHg6Qc+M.net
- 超漢字で17万文字
- 957 :デフォルトの名無しさん:2017/12/31(日) 10:27:32.66 ID:hZnZn3Kf.net
- >>954
>取るに足りない些細な違いをもって同じ文字と認めない
その手の議論はCJK統合漢字の時に散々やったんじゃないの?
- 958 :デフォルトの名無しさん:2017/12/31(日) 11:52:08.16 ID:KA+WHx0L.net
- やったから、なに?
- 959 :デフォルトの名無しさん:2017/12/31(日) 11:54:37.82 ID:BxTIUPKK.net
- >956
「超漢字」というのは東大で開発したGTフォントなのですが、
ただ、いかんせん。フォントが綺麗でないので、
例えば本文を「ヒラギノ」や「小塚明朝」で組んだ時に
GTフォントを入れると、かなり違和感を感じるので、
現在は、Adobe Japan 1-5やIPAMJにない字は、
Adobe Illustratorで作字している
- 960 :デフォルトの名無しさん:2018/01/01(月) 13:59:19.71 ID:Yzi7nKjn.net
- テキストエンコードに詳しい方、教えてください
下記リンクは日本語サイトの日本語テキストファイルですが
「ファイル名」が文字化けして文字コードが不明です(ファイルの本文は Shift_JIS でした)
「正しいファイル名」および「ファイル名の言語」(外国語?)が分かれば教えてください
また言語不明のファイル名を簡単に判別する方法があれば教えてください
http://www.monzen.org/doc/fonts/free/all/%e3%81%a6%e3%81%82%e3%81%a8%e3%82%8b%ef%bc%91%ef%bc%96/%e9-%e9%e1%e9%e3%e9%da%e9P%e9U.TTF%e9+%e9-%e9%f3%e9-.txt
- 961 :デフォルトの名無しさん:2018/01/01(月) 23:24:57.94 ID:x9zbFP4w.net
- 明けましておめでとうございます
2018年の文字コード業界はどうなるやら(去年の使い回し)
- 962 :デフォルトの名無しさん:2018/01/02(火) 12:20:49.37 ID:Y/4ObyK1.net
- >>960
て: e381a6
あ: e38182
と: e381a8
る: e3828b
1: efbc91
6: efbc96
/より後半は知らん
- 963 :デフォルトの名無しさん:2018/01/02(火) 12:36:54.34 ID:Y/4ObyK1.net
- http://www.monzen.org/doc/fonts/free/all/てあとる16/
ここの中身見たけどファイルが5個あって
1)てあとる16/てあとる16.TTFについて.txt
2)てあとる16/てあとる16.TTF
3)てあとる16/(化けてる).TTF(化けてる).txt
4)てあとる16/(化けてる)16.TTF
5)てあとる16/Theatres16.zip
たぶん (3) をダウンロードしたんだと思うけど
zip の中をみると (1) と (2) しかないから
サイズも同じだし (1)-(3) と (2)-(4) は同じ名前(文字列)なんだろうね
- 964 :デフォルトの名無しさん:2018/01/02(火) 12:49:17.66 ID:Y/4ObyK1.net
- コード見ると
てあとる: e92de9e1e9e3e9da
16: e950e955
について: e92be92de9f3e92d
なんだろうけど
e92d が「て」だけじゃなくて「つ」と思われる部分にも使われてるのが謎
- 965 :デフォルトの名無しさん:2018/01/02(火) 13:15:02.16 ID:Y/4ObyK1.net
- あとは「てあとる」をどっかの言語のコードページとかで適当に変換してみて「e92de9e1e9e3e9da」のバイト純になるものを探せ
http://docs.python.jp/3/library/codecs.html#standard-encodings
- 966 :デフォルトの名無しさん:2018/01/02(火) 22:57:59.20 ID:5gV1mnpW.net
- 「16」の部分がE950 E955なのはShift_JISから来たのかなと思うけど(Shift_JISでは8250 8255)
「てあとる」「について」は謎だな
- 967 :デフォルトの名無しさん:2018/01/03(水) 04:10:39.66 ID:v5sFvWN4.net
- >>962-966
レスありがとうございます>>960です
「てあとる16」というフリーフォントをググってこのURLに辿り着いたのですが
Firefoxのエンコード設定をいくら弄っても正規ファイル名がわからなかったので質問させていただきました
わざわざファイル名を変えてアップしてるということは何らかの意図があると思うのですが
中国語や韓国語でもなさそうだしUnicodeでも化けるので・・・ MacとWindowsを行き来して化けたとか?
管理者さんに聞くのが近道だと思いますがディレクトリ勝手に掘ったとか怒られても嫌なので放置しています
- 968 :デフォルトの名無しさん:2018/01/03(水) 12:59:16.54 ID:j114ZuXB.net
- (>>967の続き)
あと素人臭い質問ですいませんが、下記テキストファイルをWindows環境で表示する方法はありますか?
同ディレクトリにあるotf(お試しフォント)はDLできるのですがテキストファイル3個は表示もDLもできませんでした
http://www.monzen.org/doc/fonts/free.next/%e3%83%a2%e3%83%88%e3%83%a4%e3%81%8a%e8%a9%a6%e3%81%97/UD%e3%83%a2%e3%83%88%e3%83%a4%e6%98%8e%e6%9c%9d2B/ntnum2bmst/%e6%96%87%e5%ad%97%e7%a8%ae%e4%b8%80%e8%a6%a7.txt
- 969 :デフォルトの名無しさん:2018/01/04(木) 01:19:32.08 ID:gDBGL8Zs.net
- 欧文環境かなんかで文字化けしたままzipばらしたっぽいな
- 970 :デフォルトの名無しさん:2018/01/04(木) 01:35:20.16 ID:1mKOov/G.net
- >>968
403 Forbiddenが返ってきてるから、おそらくパーミッションの問題でWebサーバが
そのファイルを読み出せない
- 971 :デフォルトの名無しさん:2018/01/04(木) 09:46:56.03 ID:GKignaEj.net
- >>969-970
ありがとうございます
TXTのみDLできない設定なのですね
- 972 :デフォルトの名無しさん:2018/01/04(木) 20:41:42.26 ID:LRBrKk4Y.net
- >>967
元はShift_JISで書かれたサイトっぽいけど「webサーバー側」の文字コード設定が間違ってて
HTMLとしてすでに正しくない文字コードというかバイト列が出力されてしまってる感じで
さらにfirefoxが文字コード検出を間違ったまま表示してる感じがする
ちなみに文字化けしたままでもfirefoxでマウスオーバーしたときに左下に出て来る日本語はたまに正常たったりする
文字化けにも色々あるけど文字通り壊れたバイト列だともうどうしようもない
- 973 :デフォルトの名無しさん:2018/01/04(木) 21:05:29.96 ID:LRBrKk4Y.net
- >>968
サーバー側の設定が間違ってると間違った文字コードでリクエストしてファイルは存在してても
違うバイト列だからファイルシステム上に見つからないとかいう状態になってそうなので
あとはだめもとでHTML側のURLを使わずに
判ってる方のファイル名
www.monzen.org/doc/fonts/free.next/モトヤお試し/UDモトヤ明朝2B/ntnum2bmst/文字種一覧.txt
を自分でURLエンコードしてリクエストしてみるとか
- 974 :デフォルトの名無しさん:2018/01/04(木) 22:02:18.09 ID:LUbaT8ef.net
- 上の階層のntnum2bmst.zipなら落とせた。
- 975 :デフォルトの名無しさん:2018/01/04(木) 23:05:06.84 ID:7OOzLizu.net
- >>972-974
ありがとうございます
該当のテキストがどうしても読みたいというよりも
<何故こういう現象が起きてるのか?>のほうに興味があって質問させていただきました
文字コードの世界って本当に奥が深いですね
文字フォントについても色々疑問があるのですが、それはフォントスレで質問するべきですね
(PCにインストールしていいフォント数の上限とか)
- 976 :デフォルトの名無しさん:2018/01/05(金) 00:49:01.50 ID:76HunQx1.net
- ためになるスレだなあ
- 977 :デフォルトの名無しさん:2018/01/05(金) 17:51:46.56 ID:GkCjRoy7.net
- 無理やり読ませるとそれなりの割合の人間に急性ショック症状を起こすスレでもある・・・
- 978 :デフォルトの名無しさん:2018/01/06(土) 10:18:57.35 ID:TZFQHvv4K
- 今年はJIS漢字制定40周年の節目の年だな。
- 979 :デフォルトの名無しさん:2018/01/08(月) 12:30:50.80 ID:6qORCJqP.net
- 今年でJIS漢字制定40周年なんだな。
- 980 :デフォルトの名無しさん:2018/01/08(月) 13:20:24.34 ID:g3wGVkXu.net
- 40cmくらいのウンコード出た
長過ぎて一回で流れなかった
5回目くらいでやっと視界から消えた
- 981 :デフォルトの名無しさん:2018/01/09(火) 07:25:31.13 ID:4jYqaTLN.net
- ウンコ駆動ですね判ります
- 982 :デフォルトの名無しさん:2018/01/09(火) 11:13:21.97 ID:SxMgaYrJ.net
- ためになるスレだなあ
- 983 :デフォルトの名無しさん:2018/01/11(木) 01:29:58.58 ID:8ozacBxV.net
- 【しつもん@A】
@Windowsで同一フォルダ内に全く同じファイル名+拡張子があって不審に思い
ファイル名をメモ帳にコピペしても瓜二つ
でもWordにコピペすると片方は「ジ」や「ペ」の後ろに空白文字が出てくる
Aニコニコ動画をDLしてるとたまに「グ」が「ク_ 」に文字化けする
@Aの発生原因は分りますか? (どれもネットから落としたファイルです)
- 984 :デフォルトの名無しさん:2018/01/11(木) 01:41:04.05 ID:0E6TKJI8.net
- Wordを持ってるならその空白文字の後ろでAlt+Xしてみ
そしたら文字コードに変換されるから何がついてるか分かる
- 985 :デフォルトの名無しさん:2018/01/11(木) 02:16:47.71 ID:8ozacBxV.net
- >>984 ありがトン
@「ジ 」が「シ3099」に変わった
A「ク_ 」が「ク005F」に変わった
@は↓の「Unicode正規化」ってやつですかね? Aは分らないけど
http://tech.albert2005.co.jp/501/
- 986 :デフォルトの名無しさん:2018/01/11(木) 12:49:11.03 ID:F0gXla1d.net
- 2は、ダウンロードするソフトがファイル名に使えなさそうな文字をアンダースコアに変えてるのでは
- 987 :デフォルトの名無しさん:2018/01/11(木) 16:02:48.08 ID:rE/gsUWL.net
- 合成済み文字と結合文字列の違いは
Windowsとmacでデータのやりとりをしていると稀によくある
- 988 :デフォルトの名無しさん:2018/01/11(木) 17:06:01.77 ID:WekjUxUo.net
- >>986-987 ありがトン
A ニコニコ動画の無料アニメ2本 上の「グルグル」は文字化けしないが、下のは化ける
http://www.nico video.jp/watch/1499326505
魔法陣グルグル PV
http://www.nico video.jp/watch/1500538647
魔法陣ク?ルク?ル 第1話「旅立ち!ジミナ村!」
下の動画タイトルをWordにコピペ&Alt+Xすると「ク3099」なので、上とは違った文字コードで書かれてる模様
ブラウザ上では見分けがつかないが、DLすると「ク_ 」=「ク005F」に化ける
ニコ動はブラウザで見ることを前提にしてるのでクレームをつけるわけにもいかないが
バラバラの文字コードで書かれるとモヤッとする
- 989 :デフォルトの名無しさん:2018/01/13(土) 18:28:46.68 .net
- >>988
「魔法陣グルグル 」だけを抜き出してみると
魔法陣グルグル PV
¥u9b54¥u6cd5¥u9663¥u30b0¥u30eb¥u30b0¥u30eb¥u3000
魔法陣グルグル 第1話「旅立ち!ジミナ村!」
¥u9b54¥u6cd5¥u9663¥u30af¥u3099¥u30eb¥u30af¥u3099¥u30eb¥u3000
下の方は半角カナ(グルグル)から変換したとかかなあ
ウェブブラウザでは一見区別が付かないのも困りものだ
- 990 :デフォルトの名無しさん:2018/01/13(土) 19:15:50.63 ID:kgVvsCNy.net
- MacとかiPhoneとか、Apple製品は濁点を結合文字列で扱うのがデフォだったはず
- 991 :デフォルトの名無しさん:2018/01/13(土) 19:16:22.00 ID:bGec8C/6.net
- 半角カナから単純に変換したのであればク゛(30af 309b)になってそうだけど
- 992 :デフォルトの名無しさん:2018/01/14(日) 06:16:21.53 ID:piPpz4p9.net
- ものかのとかいう奴がそんな訳語を提唱してたっけw
- 993 :デフォルトの名無しさん:2018/01/16(火) 16:24:03.09 ID:gClSSJeQ.net
- Combining Character Sequence
公式日本語訳の「結合文字の並び」は何だか使いにくいし
- 994 :デフォルトの名無しさん:2018/01/16(火) 21:25:09.69 ID:LbNJCNQU.net
- 単一の文字を表すくせに文字列と呼ぶのもいまいちだし悩ましいところだな
- 995 :デフォルトの名無しさん:2018/01/16(火) 21:58:19.78 .net
- 「結合文字列」って、「合州国」みたいなもんか
- 996 :デフォルトの名無しさん:2018/01/17(水) 15:56:04.49 ID:9Sws3XK1.net
- 合衆国の誤字だっけ
- 997 :デフォルトの名無しさん:2018/01/20(土) 12:33:26.67 ID:4AOaXNlF.net
- http://www.gakkai.ne.jp/jss/bulletin/guide1.php
- 998 :デフォルトの名無しさん:2018/01/21(日) 14:15:27.16 ID:zFm0SEQ6.net
- ttp://ufcpp.net/blog/2018/1/getunicodecategory/
ASCII 圏の人、ほんとに Unicode 追加面を知らない
・「こんなのほっといてもすぐに追加されるだろう」とか甘い
・たぶん、日本人か中国人が言い出さないと進まない
- 999 :デフォルトの名無しさん:2018/01/21(日) 22:23:53.16 ID:b31s5s8Q.net
- Unicodeはただの絵文字コードに成り下がったよ
- 1000 :デフォルトの名無しさん:2018/01/22(月) 02:43:08.18 ID:NUz81bxR.net
- ユニコードにきちんと対応してほしいフリーソフトは多い
IrfanView
Lhaz
FileSum
- 1001 :デフォルトの名無しさん:2018/01/22(月) 02:44:17.64 ID:NUz81bxR.net
- ついでに埋め
次スレが立ったらまたよろしく
- 1002 :2ch.net投稿限界:Over 1000 Thread
- 2ch.netからのレス数が1000に到達しました。
総レス数 1002
215 KB
掲示板に戻る
全部
前100
次100
最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★