2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

文字コード総合スレ part14

1 :デフォルトの名無しさん:2023/03/03(金) 15:46:58.08 ID:yKqwMGHT.net
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 https://mevius.5ch.net/test/read.cgi/tech/1516629503/
文字コード総合スレ Part12 https://mevius.5ch.net/test/read.cgi/tech/1544931495/
文字コード総合スレ part13
https://mevius.5ch.net/test/read.cgi/tech/1593777227/

107 :デフォルトの名無しさん:2023/03/12(日) 05:55:05.23 ID:LPnCxw27.net
というか、MicrosoftとLinux以外のOSがなくなってしまったんだぜ
あとmacOSが残ってるか

108 :デフォルトの名無しさん:2023/03/12(日) 09:21:56.46 ID:zZ3L0xxp.net
そういえば、テキストだけ特別な扱いはしたくないからBOMは入れてくれるなという主張はわからんでもないが
とあるそこそこ有名なOSSは逆にストリームの先頭の EF BB BF を強制的に削るという強硬策をとってたな。

109 :デフォルトの名無しさん:2023/03/12(日) 09:39:57.05 ID:LPnCxw27.net
今はテキストファイルの話をしてる
ストリームの仕様は関係ない話だ

110 :デフォルトの名無しさん:2023/03/12(日) 10:13:38.29 ID:Cuf4mGT0.net
あほだな。テキストのストリームとか言われたら死にそうだな。

111 :デフォルトの名無しさん:2023/03/12(日) 15:01:05.66 ID:JTWw5hHO.net
UNIXはバイトストリームしかない中古品
C言語もWindows向けと違ってテキストモードとか実装して当然ものすら無いし

112 :デフォルトの名無しさん:2023/03/12(日) 16:18:15.25 ID:C6Uwumzj.net
>>111
レイヤの区別をできない素人かよ

113 :デフォルトの名無しさん:2023/03/12(日) 17:11:02.31 ID:SD5cjZL3.net
Windows の改行コードが 0D0A なのはMSDOS の名残
C言語の \n は1バイトなのだが,これを2バイトでも処理できるように
苦し紛れに作ったモードがテキストモード

114 :デフォルトの名無しさん:2023/03/12(日) 21:43:16.22 ID:JTWw5hHO.net
Why is the line terminator CR+LF?
https://devblogs.microsoft.com/oldnewthing/20040318-00/?p=40193

This protocol dates back to the days of teletypewriters. CR stands for “carriage return” – the CR control character returned the print head (“carriage”) to column 0 without advancing the paper. LF stands for “linefeed” – the LF control character advanced the paper one line without moving the print head. So if you wanted to return the print head to column zero (ready to print the next line) and advance the paper (so it prints on fresh paper), you need both CR and LF.

If you go to the various internet protocol documents, such as RFC 0821 (SMTP), RFC 1939 (POP), RFC 2060 (IMAP), or RFC 2616 (HTTP), you’ll see that they all specify CR+LF as the line termination sequence. So the the real question is not “Why do CP/M, MS-DOS, and Win32 use CR+LF as the line terminator?” but rather “Why did other people choose to differ from these standards documents and use some other line terminator?”

Unix adopted plain LF as the line termination sequence. If you look at the stty options, you’ll see that the onlcr option specifies whether a LF should be changed into CR+LF. If you get this setting wrong, you get stairstep text, where

each
  line
    begins

where the previous line left off. So even unix, when left in raw mode, requires CR+LF to terminate lines. The implicit CR before LF is a unix invention, probably as an economy, since it saves one byte per line.

115 :デフォルトの名無しさん:2023/03/12(日) 22:44:50.34 ID:myYPYrxB.net
こんなスレにおるのはほぼオッサンなんだけど
キミに学びがあったのならよかった

116 :デフォルトの名無しさん:2023/03/12(日) 22:58:02.67 ID:Cuf4mGT0.net
最後の方の Unix の記述は間違いだな。ちゃんと調査せずに適当な風説を元に回答したようだ。

117 :デフォルトの名無しさん:2023/03/12(日) 23:20:28.70 ID:Cuf4mGT0.net
1) 大昔の teleprinter/teletypewriter では CR+LF で改行にしていた。違うのもあった。
2) それを引き継いでビデオ端末の多くが CR+LF を改行にしていた。違うのもあった。
3) デバイスに直接出力していた古いOSや、OS無しの低機能のシステムではデバイスの多数派に合わせて CR+LF を改行コードにした。
4) Multics ではデバイス・ドライバーで出力先デバイスに合わせて改行処理を変更する機能があるので、デバイスに依存しない抽象化された文字コードを採用することにした。
5) このときに、当時の ISO 646 のドラフトにおいて LF だけで改行とできる規定があったので、それを採用した。
6) unix はこの Multics の仕様を引き継いだ。
#)一方で CP/M はデバイス・ドライバーによる抽象化などの高度な機能は無かったので、CR+LF を改行コードにするしかなかった。MS-DOS および MS-Windows はこの仕様を引き継いだ。

118 :デフォルトの名無しさん:2023/03/13(月) 03:18:43.79 ID:7nq5QUJ1.net
>>113
タイプライターの名残やろ

119 :デフォルトの名無しさん:2023/03/13(月) 09:07:24.07 ID:g2KgZszC.net
CP/Mのパクリをしなければ改行にCR+LFを採用する必要はなかった
まあこのパクリのおかげでCP/M86に勝ったんだけどね

120 :デフォルトの名無しさん:2023/03/13(月) 11:13:13.34 ID:bF2IN6wD.net
レトロmac: "CR" ぼくも忘れないで

121 :デフォルトの名無しさん:2023/03/13(月) 13:38:04.06 ID:L8qxRZDz.net
>>120
お前は深く考えてない玩具 Apple II の文字コード継承しただけじゃないか? 正直に白状したまえ。

122 :デフォルトの名無しさん:2023/03/13(月) 14:36:51.97 ID:7nq5QUJ1.net
Macはワンボタンが素晴らしいと思ってるし、画面下にアプリ切り替えバーなんていらないし、UNIXなんてクソだからCRを使った

123 :デフォルトの名無しさん:2023/03/13(月) 21:35:59.50 ID:Lx/25M/K.net
CRはCarriage Returnで行頭に復帰
改行はしない

124 :デフォルトの名無しさん:2023/03/13(月) 22:29:34.49 ID:bqBi0AM/.net
それ端末の動作だし
だからなんやねん

125 :デフォルトの名無しさん:2023/03/14(火) 16:02:14.81 ID:ZglUMoKm.net
読むときは CR(単独) が来ようが CR+LF(連続) が来ようが LF(単独) が来ようが LF として処理する
描くときは LF のみ描き込む
これが正しい在り方

126 :デフォルトの名無しさん:2023/03/14(火) 17:57:34.43 ID:3k2Galku.net
問題はCRとLFとCRLFが混ざっているときだ

127 :デフォルトの名無しさん:2023/03/14(火) 19:20:49.37 ID:pZL91EEN.net
LF, CR, LF, LF, LF, CR ときたら何行改行するか問題。
CR+LF 派にこれを突きつけると、 言行がバグる人が多い。CR+LF派は脳に欠陥があるに違いない。

128 :デフォルトの名無しさん:2023/03/14(火) 19:52:03.66 ID:euneF1w3.net
>>127
LRの次がCRだったら無視する(読み飛ばす)
CRの次がLFだったら無視する(読み飛ばす)
で問題なし

129 :デフォルトの名無しさん:2023/03/14(火) 19:53:53.28 ID:f/+ml7jb.net
CRLFで1回、CRで1回、LFで1回だろ?

130 :デフォルトの名無しさん:2023/03/14(火) 20:20:53.43 ID:pZL91EEN.net
LF派:誰に聞いても同じ回答を返す
CR+LF派:人によって回答が違う。謎のオレオレ理論を説明しだす
CR派:問を無視してアップルへの恨み言を言い始める

131 :デフォルトの名無しさん:2023/03/14(火) 20:23:34.83 ID:IFFVvzVH.net
BOMは諦めて今度は改行かね

132 :デフォルトの名無しさん:2023/03/14(火) 20:27:00.01 ID:f6OfJkKw.net
>>131
ワロタ

133 :デフォルトの名無しさん:2023/03/14(火) 23:03:37.37 ID:YE6RlyDJ.net
CRは先頭位置に戻す
LFは行替え
だから>>127は4行改行して先頭位置になる

134 :デフォルトの名無しさん:2023/03/14(火) 23:25:04.85 ID:9qcdp0KK.net
>>133
本来はそんなんだけど
タイプライターで打つときにそれだと二動作必要になるので
一動作でcr+lfにするようにした
これが混乱の始まりかも

135 :デフォルトの名無しさん:2023/03/15(水) 01:01:29.12 ID:GIgi9suE.net
>>133
つまり先頭位置にある時には CR は不要で LF だけで改行すべきで、
毎回 CR+LF を出力している某OSは無駄と言いたいの?
それでは CR+LF 派とは言えないよな?

136 :デフォルトの名無しさん:2023/03/15(水) 02:30:17.71 ID:ClK12XWK.net
HTTPプロトコルは改行がCR+LFなのはどうして?

137 :デフォルトの名無しさん:2023/03/15(水) 04:53:01.78 ID:GIgi9suE.net
>>136
まじめに答えると、
SMTPなどの既存のプロトコルを参考にしたから。
で、SMTPがCRLFなのは、インターネット以前の汎用機とか使ったメールシステムとの相互接続性に気を使ったから。
実際のHTMLは場所によってLFだけやCRだけの改行も許されていてかなり複雑なんだが。

138 :デフォルトの名無しさん:2023/03/15(水) 11:00:18.93 ID:ClK12XWK.net
ほー、ってことはWindowsも
そういった互換性を大切にしてたんだな

139 :デフォルトの名無しさん:2023/03/15(水) 11:12:26.56 ID:2SW2Y069.net
むしろ>>127なんて通常はあり得ないって事さ

140 :デフォルトの名無しさん:2023/03/15(水) 12:41:20.81 ID:GIgi9suE.net
>>138
まあ、そうだな。
Windows が大事にしたのは MS-DOS との互換性で、
MS-DOS が大事にしたのは CP/M との互換性で、
CP/M は大昔の汎用機と同じくらい古臭い<BS><BS><BS>シンプルな設計だったというだけだな。

141 :デフォルトの名無しさん:2023/03/15(水) 22:20:01.44 ID:ClK12XWK.net
UNIXは元々研究用だからね
互換性なんか考えちゃいない
だからUNIXはBSD系とSystemV系に分離した
多くのコマンドの互換性がなくなった

142 :デフォルトの名無しさん:2023/03/16(木) 00:21:30.90 ID:OI9tXZBe.net
>>141
歴史をまったく知らない素人妄想だな。
Multics で導入されたテキストデータの抽象化とか知ってるか?

143 :デフォルトの名無しさん:2023/03/16(木) 03:57:32.72 ID:mQ2r18kg.net
http2以降はヘッダに改行なくなったんだね、、、

144 :デフォルトの名無しさん:2023/03/16(木) 07:48:28.62 ID:svmadcyh.net
>>141
多くのコマンドの互換性ってたかだかオプションが違うくらい
シェルスクリプトでどのバージョンでも対応できた

145 :デフォルトの名無しさん:2023/03/16(木) 10:25:24.39 ID:6H39TrIH.net
>>142
知ってる。お前のターン。
俺を論破してみせろやw

146 :デフォルトの名無しさん:2023/03/16(木) 10:25:51.36 ID:6H39TrIH.net
>>144
歴史を知らんのねw

147 :デフォルトの名無しさん:2023/03/16(木) 10:41:46.04 ID:rUjwTzLK.net
知ってる→実は何もわかってない
知らんのかね→自分が何も知らない
どうして、こういう知ったかぶりする小学生みたいんな奴が混ざってるんだろう?

148 :デフォルトの名無しさん:2023/03/16(木) 10:46:31.88 ID:0AiTyYBY.net
コマンドラインにプログレスバーを出したり
固定レイアウトでリアルタイム更新する画面とか
きちんとCRとLFは区別されてるって感じる

149 :デフォルトの名無しさん:2023/03/16(木) 11:13:17.10 ID:N2/NSeFa.net
BOMは文字コード?
ZWNBSは文字コード?
CRは文字コード?
LFは文字コード?

150 :デフォルトの名無しさん:2023/03/16(木) 11:31:30.24 ID:6H39TrIH.net
>>147
俺のこと言ってる?

「知らんだろ」っていうやつは、
自分が知らないことを相手に要求して
揚げ足取ろうとしているだけだから
「知ってる」っていうと相手に大ダメージを与えられる

知ってた?

151 :デフォルトの名無しさん:2023/03/16(木) 14:30:41.33 ID:gF6V1TZr.net
知っとって知らんて言うのは犯罪やぞ

152 :デフォルトの名無しさん:2023/03/16(木) 14:32:32.77 ID:NwWFe4eh.net
>>150
無知なやつは恥も知らんなwww
自分が知らないから相手も知らないはずwww

153 :デフォルトの名無しさん:2023/03/16(木) 14:59:26.59 ID:b0tE1S4+.net
UNIX終了wwやはり正義はWindowsだったwwww

Unix is dead. Long live Unix!
https://www.theregister.com/2023/01/17/unix_is_dead/

154 :デフォルトの名無しさん:2023/03/16(木) 16:43:13.46 ID:hqbItujU.net
Unix というか Linux に徐々に移行でしょ
メインフレームやスーパーコンピュータはLinux になっちゃたし

155 :デフォルトの名無しさん:2023/03/16(木) 16:58:32.87 ID:OI9tXZBe.net
>>153
タイトルすらまともに読めてなくてw
その記事
IBM が Redhat 買ってこれからは Linux を始めとする unix-like の時代。AIX とかの(旧来の) Unix は終わり。
Windows についてはマイクロソフトも WSL を頑張ってるとしか書かれてない。

そもそも文字コードに何の関係が?

156 :デフォルトの名無しさん:2023/03/16(木) 17:04:46.17 ID:CqIyXRLu.net
>>141,153
お前 UTF-8 に BOM つけろ君だろ
教養が感じられないあたりがそっくり
主張が通らなかった、腹いせにスレを荒らすな!

157 :デフォルトの名無しさん:2023/03/16(木) 17:42:30.76 ID:6H39TrIH.net
>>156
アホ化。逆だわ
UTF-8にBOMつけるな
あれはMSが歪めた仕様
元々はバグだ
シランなら黙っとれ

158 :デフォルトの名無しさん:2023/03/17(金) 20:09:59.24 ID:kImSYq8C.net
このスレは以下で全員が一致している
・文字コードはUTF8で統一
・UTF8はBOMを付けない

159 :デフォルトの名無しさん:2023/03/17(金) 21:06:51.85 ID:2DL2Xy3z.net
https://i.imgur.com/5H1ZeBj.png
> LinuxやMacでは、ファイル名やメタデータから文字コードを判断することが多いので、BOMは不要です。

これマジ?

160 :デフォルトの名無しさん:2023/03/17(金) 21:09:37.93 ID:HCeWuFC8.net
BOMって、 UTF16とかじゃないと意味が無いやん?

161 :デフォルトの名無しさん:2023/03/17(金) 21:21:18.90 ID:Y3Hkfwer.net
一応は出典付きになってんだからそれ辿って判断しろ

162 :デフォルトの名無しさん:2023/03/17(金) 22:17:32.94 ID:axfbRcbR.net
mac のファイルシステムはリソースフォークを持っているので
そこにTextEncoding を格納しておけば良い

163 :デフォルトの名無しさん:2023/03/18(土) 09:15:45.80 ID:hvwkbmHD.net
>>159
出典を挙げてくれるところが親切だな。そのqiitaどこ?

164 :デフォルトの名無しさん:2023/03/19(日) 12:16:38.49 ID:fPDrKYk/.net
Windows のファイルシステムは拡張子を持っているので
そこが .txt なら BOM 無し UTF-8 を前提にして良い

165 :デフォルトの名無しさん:2023/03/19(日) 12:24:54.52 ID:h5llDeKs.net
おいおい
Windowsで.txtなんてそれこそ山程CP932のファイルがあるだろう(日本の場合)
それらは全て無視かい

166 :デフォルトの名無しさん:2023/03/19(日) 13:04:41.50 ID:SRrPG6Bv.net
>>165
そいつらは将来に備えて .sjt とかにでも改名しとけw

167 :デフォルトの名無しさん:2023/03/19(日) 13:31:52.51 ID:pEJ/zH5I.net
UTF-8を使う俺が困らなければ他人はどうでもいい。

168 :デフォルトの名無しさん:2023/03/19(日) 14:22:28.77 ID:SRrPG6Bv.net
>>167
UTF-8を使う俺=将来のお前
どうせ嫌でも皆がUTF-8を使うことになる
遅いか早いかの違いでしかない

169 :デフォルトの名無しさん:2023/03/19(日) 14:46:22.57 ID:pEJ/zH5I.net
遅いか早いか、まさにそこがポイントだわな。
100年後には確実に死んでいるだろうからといって明日すぐに死んでもいいなんて考える人はまずいない。

170 :デフォルトの名無しさん:2023/03/19(日) 15:05:53.25 ID:SRrPG6Bv.net
あきらめろ!もう勝負はついてしまったんだ
今は粛々と対応を進めるフェーズだ
早く対応するほど傷は浅くてすむぞ

171 :デフォルトの名無しさん:2023/03/19(日) 15:11:12.34 ID:RPlhi56t.net
>>166
むしろ新しいほうが.utf8のほうが合理的かと

172 :デフォルトの名無しさん:2023/03/19(日) 15:20:23.00 ID:SRrPG6Bv.net
>>171
あきらめろ。どうせSJISのファイルは無くなるんだ。
何ならSJISのテキスト .txt ファイル今後一切作らなくても生きていける。 UTF-8はそうはいかない。

173 :デフォルトの名無しさん:2023/03/19(日) 15:26:26.02 ID:pEJ/zH5I.net
春休みっぽいね。

174 :デフォルトの名無しさん:2023/03/19(日) 16:57:13.82 ID:SRrPG6Bv.net
今日は日曜日なんだぜ。仕事引退したご老人は気づかんかもだが。

175 :デフォルトの名無しさん:2023/03/19(日) 17:30:01.32 ID:NPoZApcF.net
C言語でShiftJISからUTF-8に変換するコードをライブラリは使用しないで書いて下さい。

以下はC言語でShiftJISからUTF-8に変換する簡単なコードです。このコードでは、ShiftJISの1バイト目が0x81以上0x9F以下または0xE0以上0xEF以下の場合には2バイト文字、それ以外の場合には1バイト文字として扱います。

#include <stdio.h>

void sjis_to_utf8(char *sjis, char *utf8) {
unsigned char c1, c2;
while (*sjis != '\0') {
c1 = *(unsigned char *)sjis++;
if (c1 <= 0x7F) {
*utf8++ = c1;
} else {
c2 = *(unsigned char *)sjis++;
if ((0x81 <= c1 && c1 <= 0x9F) || (0xE0 <= c1 && c1 <= 0xEF)) {
*utf8++ = ((c1 << 8) | c2) + 0x3C00;
} else {
*utf8++ = c1;
sjis--;
}
}
}
*utf8 = '\0';
}

int main() {
char sjis[] = "こんにちは、世界!";
char utf8[100];
sjis_to_utf8(sjis, utf8);
printf("%s\n", utf8);
return 0;
}

176 :デフォルトの名無しさん:2023/03/19(日) 17:39:03.96 ID:0QGYVmFU.net
ShiftJISって表現だと文字集合定まらないのに回答もらえんだ
どんだけクソ記事多いんだよ

177 :デフォルトの名無しさん:2023/03/19(日) 21:07:41.87 ID:Lshwza3t.net
>>162
macのリソースフォークとか、知識が化石だな
今は大概のファイルシステムが拡張ファイル属性をサポートするので、そこにメタデータを
記録することが可能

178 :デフォルトの名無しさん:2023/03/19(日) 22:36:34.34 ID:S5QK9jWm.net
apfs はxattr もresource fork も両方使える
named resource fork は無くなってるが

179 :デフォルトの名無しさん:2023/03/28(火) 06:36:26.58 ID:qh0NVSBO.net
>>175
バッファオーバーフローのチェックがなく不合格

180 :デフォルトの名無しさん:2023/03/28(火) 08:25:55.12 ID:b9xJHTM0.net
それ以前の問題だろ。>>175はChatGPTに作らせたんじゃね?

181 :デフォルトの名無しさん:2023/04/03(月) 12:56:12.62 ID:xtNXRsCH.net
AIによるプログラミングはまだ無理だね

182 :デフォルトの名無しさん:2023/04/03(月) 16:26:10.65 ID:vHpZ2WBP.net
AIって、コンピュータのくせに自分でトレース実行してバグ無いか確認しないのなw

183 :デフォルトの名無しさん:2023/04/09(日) 09:21:00.03 ID:Dm0aM9sg.net
検算してもその検算が正しいかどうかすら自身が持てないのがchatGPT

184 :デフォルトの名無しさん:2023/04/09(日) 09:22:48.40 ID:Dm0aM9sg.net
WindowsだがExcelもWordも入れてない
自分のHDD/SSDにはSJISで保存されたファイルなんてもうほぼ存在しない

185 :デフォルトの名無しさん:2023/04/09(日) 12:54:00.15 ID:/c2XAn9L.net
今MacユーザーになるともれなくUnicode絡みの問題が付いてくるよ
https://applech2.com/archives/20230402-nfd-and-nfc-issues-in-macos-13-3-ventura.html

186 :デフォルトの名無しさん:2023/04/09(日) 13:04:53.10 ID:orQE+67J.net
>>185
Mac が定期的にかかる病気。
すぐ治るけど、時間をおいてまた再発する。

187 :デフォルトの名無しさん:2023/04/09(日) 14:46:54.72 ID:auAc9wKg.net
Macは日本の野党と同じで世間からの評価が甘いよなあ。
Macが基幹業務で使われてない何よりの証拠でもあるが。

188 :デフォルトの名無しさん:2023/04/09(日) 17:56:56.24 ID:OOTdGDLa.net
地震ないのに自信たっぷりに回答するのがChatGPT

189 :デフォルトの名無しさん:2023/04/09(日) 18:30:06.98 ID:4krZSi9u.net
クエーッ!

190 :デフォルトの名無しさん:2023/04/09(日) 19:01:55.55 ID:FKzaKr3N.net
知らないことは知らない
調査した限りでは存在しない
そういう答えのほうがいいのに
なんで捏造するんだろうね

191 :デフォルトの名無しさん:2023/04/09(日) 21:05:33.99 ID:UcS23PeT.net
そういうのはだいたい、知らないと答えたらひどく怒られた経験があって委縮して育ってしまったんだと思う

192 :デフォルトの名無しさん:2023/04/12(水) 12:03:52.02 ID:+8HledST.net
自信たっぷりに嘘を答えるから
文系はすぐにだまされるωωω

193 :デフォルトの名無しさん:2023/04/14(金) 14:38:56.45 ID:M7ace2PD.net
キャラ名に「ソ」があると画面がフリーズ Switchの新作ゲームにバグ 制作会社が謝罪
https://www.itmedia.co.jp/news/articles/2304/14/news119.html

194 :デフォルトの名無しさん:2023/04/14(金) 15:45:01.31 ID:xzN0pWfJ.net
>>193
ShiftJISならバックスラッシュ誤判定だろうけど、ShiftJISなわけないよな

195 :デフォルトの名無しさん:2023/04/14(金) 15:53:05.13 ID:seuuHt2q.net
浅慮すぎるのは置いといて
ゲームだし手軽にバイト長固定で処理したかったは十分考えられる

196 :デフォルトの名無しさん:2023/04/14(金) 17:03:50.51 ID:ixIh7fyO.net
芸能人は化ける

197 :デフォルトの名無しさん:2023/04/14(金) 18:27:55.47 ID:I++sIoci.net
ネットの論調は「ソ」と言ったらSJISバグみたいになってるけど今時ありえるだろうか?
もし事実だとしたら旧作からライブラリか何かを移植して流用したのかな?

198 :デフォルトの名無しさん:2023/04/14(金) 18:50:37.36 ID:41MH6ytl.net
「ソ」とか「ポ」を含む文字列で壊れる問題、昔はS-JIS絡みで時々見かけたね

199 :デフォルトの名無しさん:2023/04/14(金) 21:31:31.20 ID:MvmRH5fr.net
ここで念のため
<!--美乳-->

200 :デフォルトの名無しさん:2023/04/15(土) 11:49:15.28 ID:nVVXe4ml.net
ノーパソ

201 :デフォルトの名無しさん:2023/04/15(土) 12:43:38.13 ID:j+1WZq2H.net
XAMPP は、MSYS2 なのか?
Windows のsjis(CP932), MySQL, PHP を使っているのかも

Ruby on Rails では、日本語のバグを避けるため、
Linux, UTF-8, PostgreSQL しか使わない

202 :201:2023/04/15(土) 12:55:47.99 ID:j+1WZq2H.net
>>193
アイディアファクトリー(コンパイルハート)のゲーム開発の求人には、

C/C++, C#, Windows, Unity と書いてある

203 :デフォルトの名無しさん:2023/04/16(日) 08:38:15.57 ID:3UxBQXGl.net
Unityの文字化けを解消する!
https://qiita.com/kumi0708/items/2f8dd2fc2ccb673ff12b

UnityからC#のスクリプトファイルを作成するとUTF-8(BOM無し)になりますが、
VisualStudioはUTF-8(BOM付き)じゃないとコードページを解釈できずにShift-JISになってしまうようです。

204 :デフォルトの名無しさん:2023/04/16(日) 11:48:59.76 ID:SPigkToS.net
WindowsがUTF-16だと知らないのは不思議だな

205 :デフォルトの名無しさん:2023/04/16(日) 12:01:24.12 ID:kKWUTzzz.net
SwitchとWindowsでBOMなしテキスト使ってると、結構困ったことになるんだよね
char:Switch=utf8 Win32=sjis
wchar_t:Switch=utf32 Win32=utf16
char16_t/char32_t:対応しているライブラリが少ない

206 :デフォルトの名無しさん:2023/04/16(日) 12:09:09.12 ID:zYleX6N8.net
ターゲット固定なのにそんなのある?
ネットとか客先とか何くるかわからん状況じゃないんだし

207 :201:2023/04/17(月) 12:35:43.54 ID:4hNaPs7t.net
Windows はUTF-16 か。
確か、Ubuntu はUTF-32 とか?

たとえLinux 内部で、4バイト文字を使っていたとしても、
Ruby などのウェブ系言語では、UTF-8 前提でモジュールを作るでしょ?

CP932 の「表・ソ」などのダメ文字は、数十年前の話

272 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver.24052200