2ちゃんねる スマホ用 ■掲示板に戻る■ 全部 1- 最新50    

青空文庫 11棚目

1 :無名草子さん:2022/05/03(火) 21:14:18.76 .net
青空文庫
https://www.aozora.gr.jp/

【前スレ】
青空文庫 10棚目
https://mevius.5ch.net/test/read.cgi/books/1556609356/

【過去スレ】
青空文庫
http://book.5ch.net/test/read.cgi/books/1053625425/
※青空文庫 2冊目※
http://book3.5ch.net/test/read.cgi/books/1073138957/
【※】青空文庫 3棚目【※】
https://book3.5ch.net/test/read.cgi/books/1090913506/
【※】青空文庫4棚目【通りすがり】
https://book3.5ch.net/test/read.cgi/books/1107162580/
青空文庫 5棚目
https://love6.5ch.net/test/read.cgi/books/1152838732/
青空文庫 6棚目
https://kamome.5ch.net/test/read.cgi/books/1272024810/
青空文庫6.5棚目
https://toro.5ch.net/test/read.cgi/books/1284042704/
青空文庫 7.5棚目
https://toro.5ch.net/test/read.cgi/books/1330433965/
青空文庫 8棚目
https://peace.5ch.net/test/read.cgi/books/1349105770/
青空文庫 8.5棚目
https://mevius.5ch.net/test/read.cgi/books/1427638306/
青空文庫 9棚目
https://mevius.5ch.net/test/read.cgi/books/1507638527/

2 :無名草子さん:2022/05/03(火) 21:14:51.14 .net
【青空文庫について】

青空文庫早わかり
https://www.aozora.gr.jp/guide/aozora_bunko_hayawakari.html

青空文庫のしくみ
https://www.aozora.gr.jp/aozora_bunkono_shikumi.html

青空文庫収録ファイルの取り扱い規準
https://www.aozora.gr.jp/guide/kijyunn.html

青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

耕作員を志願される皆さんへ
https://www.aozora.gr.jp/guide/kousakuin.html

青空文庫への作品収録を望まれる方へ
https://www.aozora.gr.jp/guide/shuuroku.html

図書カード:青空文庫の提案 (青空文庫)
https://www.aozora.gr.jp/cards/001790/card56572.html

図書カード:「天に積む宝」のふやし方、へらし方 (富田 倫生)
https://www.aozora.gr.jp/cards/000055/card59489.html

青空文庫 - Wikipedia
https://ja.wikipedia.org/wiki/%E9%9D%92%E7%A9%BA%E6%96%87%E5%BA%AB

3 :無名草子さん:2022/05/03(火) 21:15:13.25 .net
【主な青空文庫の関連・派生サイト(順序不同)】

本の未来基金
https://honnomirai.net/

aozorahack
https://aozorahack.org/

青空WING
https://aozorawing.osdn.jp/

ふりがな文庫
https://furigana.info/

青空朗読
http://aozoraroudoku.jp/

4 :無名草子さん:2022/05/03(火) 21:16:14.51 .net
【主な青空文庫の類似サイト(順序不同)】

国立国会図書館デジタルコレクション
https://dl.ndl.go.jp/

Wikisource
https://ja.wikisource.org

プロジェクト杉田玄白
https://www.genpaku.org/

うわづら文庫
http://www.let.osaka-u.ac.jp/~okajima/uwazura.html

科学図書館
http://www.cam.hi-ho.ne.jp/munehiro/science/scilib.html

PD図書室
http://books.salterrae.net/

5 :青空文庫アクセスランキング:2022/05/05(木) 19:32:33 .net
2022年4月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_04_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_04_txt.html

6 :aozorablog:2022/05/09(月) 12:28:24.03 .net
青空文庫’22/03月-’22/04月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5033

7 :無名草子さん:2022/05/15(日) 17:11:39.20 .net
アメリカで著作権保護期間を短縮する法案(遡及適用あり)が提出されたらしい
まぁ日本の保護期間延長はアメリカ云々ではなく欧州に歩調を合わせたもの(日欧EPAによる取り決め)だが


米国:「Woke」したディズニーへの報復として著作権保護期間を56年に短縮する法案が提出される | P2Pとかその辺のお話R
https://p2ptk.org/copyright/3582

ディズニーの著作権の特別保護を剥奪する法案をアメリカ上院議員が提出、2022年内にミッキーが「フリー素材」化する可能性 - GIGAZINE
https://gigazine.net/news/20220513-disney-copyright-hawley/

8 :無名草子さん:2022/05/15(日) 18:11:47.16 .net
これで十分だ。

> 1970年にアメリカで初めて成立した著作権法は、「14年間」の保護期間という短いものでした。

9 :無名草子さん:2022/05/15(日) 20:52:31.27 .net
というか没後何年じゃなくて公開後何年にしてほしい
存命中は延長申請可とかの特例措置で折り合いを付けて

「没年が重要な基準なのに著作者がいつ亡くなったのかが必ずしも分かるわけじゃない」というのが著作権上の問題の1つなので


あと保護期間中に著作者が亡くなったらどうするのかという「著作者や著作権承継者の連絡先が分からない」問題については著作権情報センターあたりで管理・仲介をしてほしいな

10 :無名草子さん:2022/05/16(月) 20:30:42.46 .net
アメリカだと、一定の年数の作品だと公開後95年じゃなかったっけ?
(だから日本だと保護期間がある作家や画家の作品がWikipediaとかで公開されてたりする)

11 :無名草子さん:2022/05/17(火) 02:47:42.02 .net
したらば、爆 サ イは企業(パチンコ店など)と提携してステマをしてる可能性が高い(ステマ掲示板)。
5ちゃん(2ちゃん)も?
掲示板は企業がステマするためのサイトになってる。
したらば、爆サイ、5ちゃんの管理人はユーザーをハッキングして個人情報を覗き見してる。
したらば、爆サイ、5ちゃんの管理人はユーザーを特定しようと自宅やネカフェまで探しに来る。
管理人はユーザーが掲示板を見てるだけでも今どこを見てるか分かります。
掲示板を見るだけのときも必ず匿名性の高いプロキシを使ってください(低いのは意味ないです)。

爆サイ管理人=したらば管理人=ネット工作会社ピットクルー=パチンコ店(パチンコ業界)。
爆サイ管理人(したらば管理人)、ネット工作会社ピットクルー、パチンコ店社員は連絡取り合いながら連携してパチンコ店スレに書き込んでるようです。
「客の悪口荒らし」「長文荒らし」をしてるのは爆サイ管理人(したらば管理人)やピットクルーやパチンコ店社員です。
それを削除してるのも同じ爆サイ管理人です。
ニコニコは5ちゃん管理人と情報を交換していたから安全ではない。

ピットクルーなどが爆サイ管理人もしてます。
爆サイ、したらば、5ちゃんはパチンコ業界などの資金で運営されてるようです。

パチンコ店は無抽選台に遠隔大当たり信号を送って大当たりさせてるだけです。
大当たり確率は嘘です。
パチンコ店は営業中に確率を自由に変えています。
パチンコ、スロットは詐欺です。
そして店は暴力団配下のサクラ軍団の台に遠隔大当たりをさせ、サクラ軍団は違法に年間数億円、数10億円を稼いでいます。
大手パチンコ店でも大勝ちしてるのはこのサクラ軍団ばかりです。

マルハン、楽園などの大手パチンコ店は顔認証データを交換していて、勝たせた客が他店で勝てないようにしてます(最後は全員負けるようになってる)。
嫌がらせ対象に選ばれた客の顔認証データも交換していて、その客が来店して席に着いた瞬間に隣や後ろの台を大当たりさせる嫌がらせをしてきます。
この客は他の席に移動してもすぐに隣や後ろの台を大当たりさせる。
これはパチンコ店の違法行為、犯罪です
パチンコ店の社員は偏差値40くらいしかないです。

12 :無名草子さん:2022/05/19(木) 23:46:54.93 .net
底本も古い作品に関しては、これで入力・校正が更に捗るな。

「個人向けデジタル化資料送信サービス」の開始について(付・プレスリリース)|国立国会図書館―National Diet Library
https://www.ndl.go.jp/jp/news/fy2022/220519_01.html

13 :無名草子さん:2022/05/26(木) 12:42:36.42 .net
DLは1月からだからそれまでは手持ちの底本で作業しよう。
しかしありがたいことだ

14 :無名草子さん:2022/05/26(木) 19:42:05.93 .net
>>12のニュースは青空文庫とは直接関係ないのでは?
著作権保護期間中であっても一定条件を満たせば閲覧やダウンロードが可能になるということだけど
これはあくまでも国会図書館と個人利用者との間のやりとりの話であって、第三者へのデータ再配布が許可されたわけではないでしょ

15 :無名草子さん:2022/05/26(木) 20:44:47.36 .net
図書館に行ったり国会図書館に複写送付頼まなくても、家から底本が確認できるってことじゃない?

16 :無名草子さん:2022/05/26(木) 20:51:02.35 .net
>>14
国立国会図書館デジタルコレクションの限定公開の基準だと序文や挿絵とか装幀とかで1人でも著作権保護期間中の人が居たら裁定か限定公開になるから
(※ちなみに完全に著作権保護期間が満了してても復刻版が市販されてたら限定公開になる場合がある)
本文を書いた人は著作権保護期間満了してるとか分担執筆で第○章だけは著作権保護期間満了してるとかの部分は普通にパブリックドメインなので青空文庫に収録できる


そしてそういう再版も復刻もしてないような入手が困難な古い作品(しかも全く同じ底本)を
入力者も校正者も青空文庫の運営側も簡単に閲覧出来る状況になったわけだから入力や校正のやりやすさは格段に上がった

古い本だと仮に古書店で手に入れられてもコピーやスキャンが大変なレベルで劣化してたり元の所蔵者の書き込みがあったりするし
そもそも国立国会図書館以外の所蔵がほとんど確認できない本も少なくない

17 :14:2022/05/26(木) 22:09:44.43 .net
>>16
なるほどそういうことか
言われてみればたしかに「著作権が切れてるはずなのに、なんで限定公開なの?」って作品がありました

18 :無名草子さん:2022/05/26(木) 22:39:31.76 .net
デジタルコレクションの図書館・個人送信限定のやつって
国立国会図書館の転載に関する利用規約を読むと複写物の(つまり画像としての)話しかしてない気がするけど
青空文庫みたいに文字起こしにして公開するのは問題ないのかな

国立国会図書館ウェブサイトからのコンテンツの転載 |国立国会図書館
https://www.ndl.go.jp/jp/use/reproduction/index.html

掲載/展示/放映/インターネット・ホームページ等への掲載のための国立国会図書館デジタルコレクションの画像データ提供(試行)|国立国会図書館
https://www.ndl.go.jp/jp/copy/reproduction/index.html
青空文庫側は前々から備考欄に
>国立国会図書館デジタルコレクション(https://dl.ndl.go.jp/)で公開されている当該書籍画像に基づいて、作業しました。
って書くようにしてるっぽいけど

青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

19 :無名草子さん:2022/05/27(金) 12:18:57.86 .net
国立国会図書館デジタルコレクションは本単位で公開/限定公開が決められてるっぽいけど
青空文庫は著者単位で収録されるからそこだけ抜き出して読んでも面白いもの作品は入力されるかもね

特に雑誌の寄稿なんかは分量も多くないし本を出してないような人でも書いてる場合があるから
「この人って作家や学者じゃないけど文章を遺してたんだ」みたいな人が収録されるかもしれない

20 :19:2022/05/27(金) 12:29:32.63 .net
人任せみたいになってしまったけど自分は自分でこの話題が出る前から入力中/校正中の作品があるので……

21 :無名草子さん:2022/05/27(金) 15:29:56.44 .net
個人送信のものは権利者からの除外申請で今後見れなくなる可能性もあるのね。
アクセスしやすいから底本にしたのに、デジコレで見れなくなって逆にアクセスの難易度が上がることもあるかも

22 :無名草子さん:2022/05/27(金) 16:12:26 .net
かつて夢野久作の犬神博士は青空文庫で公開されていまいたが、今は作業中かつ非公開になっているようです。
過去に公開された版になにか問題があってそれは今公開することは不適切なのでしょうか?

23 :無名草子さん:2022/05/27(金) 19:22:08.89 .net
>>22
入力者がYahoo!ジオシティーズで青空文庫と同じフォーマット(ただし校正者欄等は空白)で公開してたらしいのでそれと混同してるのではないでしょうか

https://web.archive.org/web/20190330051028/http://www.geocities.jp/tamiyagi2/inugami_hakase.html
※インターネットアーカイブ


青空文庫内を検索しても2005年のそらもようの

>入力中としてきた、夢野久作「犬神博士」(新字新仮名)、横光利一「寝園」(新字新仮名)、幸田露伴「五重塔」(新字新仮名)、矢田津世子「仮面」(新字新仮名)を、入力取り消しに変更しました。

https://www.aozora.gr.jp/soramoyou/soramoyou2005.html

という報告しか見当たらなかったので青空文庫では公開されてなかったと思います

24 :23:2022/05/27(金) 19:39:19.60 .net
一応過去スレも確認したけど

>夢野久作の犬神博士.
>1998/09/14入力開始として2004/04/08現在で5年半ほど放置されたまんまですねぇ......
>どうするつもりなんだろ?

https://mevius.5ch.net/test/read.cgi/books/1073138957/369

という書き込みを発見しただけで終わった

25 :無名草子さん:2022/05/27(金) 20:49:52.36 .net
>>23-24
なるほど私の勘違いのようですね。ありがとうございました。

26 :無名草子さん:2022/05/28(土) 01:09:15.20 .net
2004年のスレを流し読みしたけど色んな意味で時代を感じるな……

27 :無名草子さん:2022/05/28(土) 06:48:24.95 .net
>>19
私は実際に、とある女性画家の画集(展覧会図録)に、「掲載先不明」って扱いで載ってた文章が気になって、その画家の事を調べていたら地元の図書館で閲覧できる国会図書館のサイトで偶然掲載元を発見して、そこから青空文庫に載せました。

28 :無名草子さん:2022/05/28(土) 19:05:34.33 .net
前スレで『コロロッチョ』って何だよみたいなこと書いたけど
「コロロッチョ」は登場人物の名前で原文(下記参照)では"Grillino"だった

というか何の救いもない理不尽な童話だな……

Il raccontafiabe/Grillino - Wikisource
https://it.wikisource.org/wiki/Il_raccontafiabe/Grillino

29 :無名草子さん:2022/05/30(月) 23:56:16.50 .net
本文を書いた著者の著作権が切れてない本で別の著作権が切れた人の書いた序文とかは
本文を書いた著者の作品が収録できなくて苦渋を嘗めた工作員への手慰みになる

30 :2022年6月公開予定作品一覧:2022/05/31(火) 18:27:15.93 .net
2022-06-01 ホワイト フレッド・M『悪の帝王 12 第12話 マルコス将軍』
2022-06-02 柳田 国男『おばけの声』
2022-06-03 山本 周五郎『艶妖記 忍術千一夜 第一話』
2022-06-04 李 箱『街衢ノ寒サ ――一九三三 二月十七日ノ室内ノコト――』
2022-06-05 中谷 宇吉郎『大阪人と科学精神』
2022-06-06 グリム兄弟『三つのことば』
2022-06-07 管野 須賀子『肱鉄砲』※誕生日
2022-06-08 作者不詳『現代語訳 平家物語 06 第六巻』
2022-06-09 有島 武郎『小さき影』※命日(星座忌)
2022-06-10 大町 桂月『鎌倉大仏論』※命日
2022-06-11 山本 周五郎『三悪人物語 忍術千一夜 第二話』
2022-06-12 小川 未明『雪くる前の高原の話』
2022-06-13 田山 花袋『月明夜々』
2022-06-14 チェスタートン ギルバート・キース『共産主義者の犯罪』※命日
2022-06-15 中谷 宇吉郎『九谷の皿』
2022-06-16 芳賀 矢一『鎌倉』※誕生日

31 :2022年6月公開予定作品一覧:2022/05/31(火) 18:27:54.88 .net
2022-06-17 寺田 寅彦『赤』
2022-06-18 坂口 安吾『豊島さんのこと』※豊島与志雄命日
2022-06-19 パスカル ブレーズ『パスカルの言葉』※誕生日
2022-06-20 永井 荷風『枯葉の記』
2022-06-21 岡本 かの子『ひばりの子』
2022-06-22 山本 周五郎『おさん』『日日平安』※誕生日
2022-06-23 壺井 栄『風』※命日
2022-06-23 三木 露風『修道院の月』※誕生日
2022-06-24 中谷 宇吉郎『御馳走の話』
2022-06-25 オーウェル ジョージ『あなたと原子爆弾』※誕生日
2022-06-26 山川 健次郎『マルクス主義は科学にあらず』※命日
2022-06-27 石川 善助『仙台の夏』※命日
2022-06-28 山本 周五郎『四日のあやめ』
2022-06-29 寺田 寅彦『「万年筆」欄より』
2022-06-30 田山 花袋『夏』

32 :無名草子さん:2022/05/31(火) 22:26:03.85 .net
来月は
・管野須賀子(1881-1911、幸徳事件で処刑された死刑囚)
・パスカル(1623-1662、フランスの哲学者)
・山川健次郎(1854-1931、元東大・九大・京大総長)
が新しく入るのか

中々に濃いメンツだ

33 :無名草子さん:2022/06/01(水) 17:06:39.71 .net
それにしても、幸徳秋水は真っ先に入ったのに他の処刑された人物は今に至るまでそんなに入らなかったのは何故なのか……

34 :無名草子さん:2022/06/01(水) 19:34:44.01 .net
・誰もその人に興味がない
・その人に興味を持つ層が青空文庫工作員に居ない
・その人に興味がある青空文庫工作員の居住地では底本の入手が困難

今回は該当しないけど場合によっては「そもそも(活版印刷による)著作物がない」という可能性もある

35 :無名草子さん:2022/06/01(水) 20:47:21 .net
Twitterとかだと、いろいろ政治的な話をしてる人や戦前または戦時中の日本の話題を良かれ悪かれしてる人がいっぱいいるのに、あんまりその時代の思想家や政治家の文章が青空文庫に入らないのも不思議だよね
(知ってる限りだと、石原莞爾や北一輝があるくらい…)

36 :無名草子さん:2022/06/01(水) 21:49:37.70 .net
良かれ側の層は出版された専門書とか論文を読むだろうし
悪かれ側の層は電子とか紙とか専門性とか以前にそもそも本なんか進んで読まないでしょ

37 :無名草子さん:2022/06/01(水) 22:04:42.96 .net
僅かではあるけど専門書的な作品は一応あるよね

38 :無名草子さん:2022/06/01(水) 23:56:32.94 .net
あと単純に有名な作品(または広めたい作品)がまだ著作権切れてないから入力出来ないってパターンもある

39 :無名草子さん:2022/06/03(金) 12:40:09.38 .net
分野別リストで政治の欄を見ると124件ある

青空文庫 分野別リスト:31 政治
https://yozora.main.jp/3/ndc31.html

40 :無名草子さん:2022/06/04(土) 07:39:18.53 .net
戦前や戦後すぐの首相はだいたいパブリックドメインだと思うけど、何割ぐらい網羅されてるんだろう?
(有名な東条英機もページすらできてないような……)

41 :無名草子さん:2022/06/04(土) 15:29:02 .net
>>40
せっかくだから調べてみた
今ある校了作品が全員公開されると約1割(34人中4人)になるね

1967年以前死亡の内閣総理大臣は34人

公開中の作品があるのは2人(5.9%)
→大隈重信、吉田茂

作業中の作品だけがあるのは6人(17.6%)
→伊藤博文、松方正義、西園寺公望、山本権兵衛、高橋是清、池田勇人
※高橋是清と池田勇人は校了作品あり
※山県有朋は校正待ち作品あり

ページのみあるのは1人(2.9%)
→原敬

42 :無名草子さん:2022/06/04(土) 16:32:15.68 .net
大隈重信→早稲田出身か佐賀出身が頑張った?
吉田茂→1967年没だから2018年1月1日のパブリックドメインデイに合わせて頑張った?

あたりかな?

43 :無名草子さん:2022/06/05(日) 10:43:21.90 .net
>>41
幣原喜重郎も公開されてるから3人じゃない?
それから、校了の高橋是清作品は秘書官の上塚司の編集等が入ってるから2049年まで公開できない。

44 :青空文庫アクセスランキング:2022/06/05(日) 12:08:34.01 .net
2022年5月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_05_xhtml.html
※書き込み時点で1位から10位までの作品名と著者名が空白(何かしらの人為的ミスか不具合?)

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_05_txt.html

45 :無名草子さん:2022/06/05(日) 18:29:41.10 .net
>>43
見落としてた
失敬

46 :無名草子さん:2022/06/06(月) 18:36:18.28 .net
前もこんなのなかったっけ?

47 :aozorablog:2022/06/06(月) 23:13:52.97 .net
青空文庫’22/04月-’22/05月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5050

48 :無名草子さん:2022/06/09(木) 22:19:23.49 .net
早稲田創立者の大隈重信や慶應義塾創立者の福沢諭吉は結構あるけど他の大学創立者はほとんど網羅されてない……みたいなのもある

49 :無名草子さん:2022/06/12(日) 13:49:53.97 .net
>>48
津田塾大学の津田梅子さんは校了してるからそのうち入るよ

50 :無名草子さん:2022/06/12(日) 15:59:15.47 .net
新紙幣つながりで北里大学学祖の北里柴三郎も考えなきゃな
(※渋沢栄一は作業中作品あり)

51 :無名草子さん:2022/06/12(日) 22:13:33 .net
>>49
なるほど
ググったらデジタルコレクションでも読めるっぽいけど良い流れですな

52 :無名草子さん:2022/06/12(日) 23:51:43.10 .net
新紙幣とか時代劇とか何かしらのきっかけで急に話題性が出た時に「この人青空文庫に作品載ってるじゃん!!」って形の話題に出るように先手に回りたいねぇ
(それで話題になるのは自叙伝とか回顧録とかに限定されそうだけど……)

53 :無名草子さん:2022/06/14(火) 22:09:34.50 .net
人なり作品なりの種類を増やしたいのは分かるがまずは目の前の作業中作品を公開作品にすることを考えよう
特に「校正中」でいくつかストップさせてる俺

54 :無名草子さん:2022/06/19(日) 22:21:05.50 .net
ある作品を入力しようかと考えてるんだけど底本候補が初出誌、単行本、作品集、著作集、選集、全集……と色々あって有名な作品は底本を選ぶのが難しいね
文字遣いの別や総ルビ/パラルビの別、後の発行による加筆訂正の有無があれば複数の底本を収録するという道も残るらしいけど

55 :無名草子さん:2022/06/20(月) 22:48:50.79 .net
「VSCode」を縦書きビューや文字数カウントを備えた原稿エディターにする拡張機能「novel-writer」/青空文庫注記法の注記やルビにも対応。品詞の色分け表示やPDF出力もできる【レビュー】 - 窓の杜
https://forest.watch.impress.co.jp/docs/review/1417878.html

>本拡張機能を「Visual Studio Code」に導入すると、テキストファイルを開いた際に、青空文庫注記法のルビや傍点などが強調表示されるほか、単語が品詞ごとに色分けされて表示される。

56 :無名草子さん:2022/06/23(木) 11:54:06.14 .net
どこかで曇天文庫がひっそりと復活してる、とかはないか…

57 :無名草子さん:2022/06/24(金) 19:22:07.34 .net
近代書籍の旧字や複雑なレイアウトに対応したOCRソフト発売、90%以上の読み取り精度 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/news/1419225.html

欲しい

58 :無名草子さん:2022/06/25(土) 14:40:21.79 .net
>>56
yahooブログ終わる前に全部DLして曇天文庫読むためにkindle端末を買ったよ

59 :無名草子さん:2022/06/26(日) 15:13:59.28 .net
>>56
下記ツイートが事実という前提だとして
普通に考えたらやりたくてもやりたくないだろうなぁ

https://twitter.com/bsbakery/status/1487675595211567104
(deleted an unsolicited ad)

60 :無名草子さん:2022/06/26(日) 15:34:52.42 .net
日本語がおかしい

61 :無名草子さん:2022/06/26(日) 15:47:14.61 .net
曇天文庫みたいな活動それ自体についてはまたやりたいと思ったとしても
それを悪用する輩の存在を考えると活動そのものへのモチベーションとは別にやりたくなくなるだろうってことでしょ

62 :無名草子さん:2022/06/26(日) 16:24:03.02 .net
青空文庫作品の利権を奪ったわけじゃないんでしょう?
kindleに廉価版のドストエフスキーとかあるけど
青空文庫で校正待ちになるより販売して収益を得ても
それはそれで利用者側としてもメリットがあるんだし。

63 :無名草子さん:2022/06/26(日) 16:53:29.74 .net
曇天文庫を悪用したという話題でないのか。

64 :無名草子さん:2022/06/26(日) 17:19:50.55 .net
青空文庫の作品を朗読して自分のホームページとかYouTubeあたりに公開してたら勝手にCDにされて売られてたみたいな話でしょ

65 :無名草子さん:2022/06/27(月) 22:03:24.74 .net
Kindle化されたときはtxt配布やめてmobiとepubで続けてたんじゃなかったっけ?
発表待ちで作っておいたのが、70年になって気持ちが折れたような気がする

66 :無名草子さん:2022/06/27(月) 23:09:07.28 .net
>>65
収録作品選んで目次作って表紙作ってmobiやepubに変換して、手間ひまかけて電子書籍にしたのに、それをそのまんま勝手にkindleストアとかで売られたらもうやめよってなるんじゃないの

67 :無名草子さん:2022/06/28(火) 03:28:29.54 .net
>>66
もちろんそれも大きな要因だと思うけど、パクられてたあともいくつかアップしてくれてたんだよね
著作権の延長の年に止まったんで、これで完全にやる気なくしてしまったのかなと

68 :2022年7月公開予定作品一覧:2022/06/30(木) 19:06:12.44 .net
2022-07-01 稲生 正令『三次実録物語』※作品初公開
2022-07-02 ホワイト フレッド・M『ドレントン・デン特派員の冒険 01 第一回 黄蛾』
2022-07-03 山本 周五郎『青竹』
2022-07-04 中谷 宇吉郎『科学の限界』※誕生日
2022-07-05 山本 周五郎『葦は見ていた』
2022-07-06 作者不詳『現代語訳 平家物語 07 第七巻』
2022-07-07 寺田 寅彦『天河と星の数』※七夕
2022-07-07 ドイル アーサー・コナン『最後の事件』※誕生日
2022-07-08 山本 周五郎『荒法師』
2022-07-09 アーヴィング ワシントン『新浦島』※翻訳者(森鴎外)命日(鴎外忌)
2022-07-10 賀川 豊彦『死線を越えて 01 死線を越えて』※誕生日
2022-07-10 熊平 武二『告・原民喜』※誕生日、作品初公開
2022-07-11 山本 周五郎『石ころ』
2022-07-12 岡本 かの子『智慧に埋れて』
2022-07-13 山本 周五郎『一人ならじ』
2022-07-14 中谷 宇吉郎『人工衛星へ汲取舟が行く話』
2022-07-15 植木 枝盛『官僚は減るべし、役人は増えるべし』

69 :2022年7月公開予定作品一覧:2022/06/30(木) 19:07:02.73 .net
2022-07-16 山本 周五郎『艶書』
2022-07-17 司馬 遷『国訳史記列伝 05 孫子呉起列伝第五』※翻訳者(箭内亙)誕生日
2022-07-18 寺田 寅彦『蚊帳の研究』
2022-07-19 永井 荷風『夏すがた』
2022-07-20 山本 周五郎『危し? 潜水艦の秘密』
2022-07-21 坂口 安吾『選後感〔第二十六回芥川賞選後評〕』※第167回芥川龍之介賞受賞作発表日
2022-07-22 山本 周五郎『黒襟飾組の魔手』
2022-07-23 葛西 善蔵『呪はれた手』※命日
2022-07-24 芥川 竜之介『読書の態度』※命日(河童忌)
2022-07-24 谷崎 潤一郎『文壇昔ばなし』※誕生日
2022-07-25 山本 周五郎『幽霊屋敷の殺人』
2022-07-26 中谷 宇吉郎『校正の話』
2022-07-27 山本 周五郎『骸骨島の大冒険』
2022-07-28 江戸川 乱歩『薔薇夫人』『魔術師』※命日(石榴忌)
2022-07-29 山本 周五郎『謎の頸飾事件』
2022-07-30 伊藤 左千夫『竹乃里人』※命日(左千夫忌)
2022-07-30 谷崎 潤一郎『日本に於けるクリップン事件』※命日(潤一郎忌)
2022-07-30 新美 南吉『空気ポンプ』※誕生日
2022-07-31 柳田 国男『幻覚の実験』『忘れ難い郷里のたべ物』※誕生日

70 :無名草子さん:2022/06/30(木) 22:36:59.32 .net
7月に新しく収録されるのは2人か

稲生正令(1735-1803)…江戸時代中期の武士
熊平武二(1906-1960)…原民喜の旧友でもある詩人

71 :無名草子さん:2022/06/30(木) 22:53:48.28 .net
妖怪文献界の古典が公開されるとは、珍しい……

72 :無名草子さん:2022/07/01(金) 15:28:09.81 .net
山本周五郎はどれ読んでもおもしろいのすごい

73 :無名草子さん:2022/07/01(金) 16:51:21.45 .net
今月、誕生月より山周多い

74 :無名草子さん:2022/07/02(土) 06:50:31.33 .net
山本周五郎だけでも青空文庫の存在意義がある...と言ったら怒られるかなw

75 :無名草子さん:2022/07/02(土) 10:29:00.52 .net
山本周五郎読んでないままだけどそんなに面白いのか

76 :無名草子さん:2022/07/02(土) 11:10:22.51 .net
青空文庫呼びかけ人の1人である富田倫生さんは
自身のTwitterアカウントを『あおべか物語』から取って「aobeka」 にしたり
「周五郎さんの公開に立ちあえたら、本望だなあ」(朝日新聞2011年6月10日)と語ったりしていたが
山本周五郎が公開される2018年1月1日を待たずして2013年に病気で亡くなってしまった

77 :無名草子さん:2022/07/02(土) 13:04:47.44 .net
富田倫生の怨霊が時を遡り、山本周五郎を5年早く呪殺する怪談を、誰か書かないかな。

78 :無名草子さん:2022/07/03(日) 02:50:01.90 .net
ホラー×SF×社会派?

79 :青空文庫アクセスランキング:2022/07/05(火) 07:07:48 .net
2022年6月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_06_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_06_txt.html

80 :無名草子さん:2022/07/06(水) 21:03:32 .net
>>74
吉川英治さんとかも人気じゃない?
あと宮本百合子さんと小川未明さんの充実ぶり

81 :そらもよう:2022/07/07(木) 12:18:40.02 .net
2022年07月07日 青空文庫の「式年遷宮」に向けて
https://www.aozora.gr.jp/soramoyou/soramoyouindex.html

82 :無名草子さん:2022/07/07(木) 12:23:37.97 .net
青空文庫と式年遷宮アーキテクチャ: 青空文庫200周年に向けて
https://www.slideshare.net/takahashim/aozora20th-2017

式年遷宮で思い出したが青空文庫20周年ももう5年前か……

83 :無名草子さん:2022/07/07(木) 15:02:30.09 .net
作業した作品が初めて校了になってた
気長に待ってたけど嬉しいね

84 :無名草子さん:2022/07/07(木) 21:19:17.84 .net
>>83
おめでとう(?)

85 :無名草子さん:2022/07/07(木) 21:38:27.38 .net
やっぱりGmailで不具合が起こってたんだなぁ
自分もGmailだけど、うまく送れるように設定するのはどうすれば……

86 :無名草子さん:2022/07/07(木) 23:27:30.33 .net
>>83
おめでとうございます。

ちなみに点検していただいて校了まで、どれくらいかかるものですか?

とはいえ作品サイズやいろんな条件で、けっして一律でも受領順でもないのでしょうけれども

87 :無名草子さん:2022/07/11(月) 22:33:53.27 .net
青空文庫、25周年を記念してオンラインでの「ささやかな催し」を企画中。近日発表か【やじうまWatch】 - INTERNET Watch
https://internet.watch.impress.co.jp/docs/yajiuma/1423746.html

88 :無名草子さん:2022/07/12(火) 20:00:24.73 .net
青空怪談 〜青空文庫の怖い話50選〜|みもねる|note
https://note.com/mimonelu/n/n84b11a67629e

89 :無名草子さん:2022/07/14(木) 22:05:24.01 .net
文豪 森鴎外の直筆原稿の一部 新たに見つかる | NHK
https://www3.nhk.or.jp/news/html/20220714/k10013718191000.html

図書カード:渋江抽斎 (森 鴎外)
https://www.aozora.gr.jp/cards/000129/card2058.html

90 :aozorablog:2022/07/15(金) 23:48:00.28 .net
青空文庫’22/05月-’22/06月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5067

91 :無名草子さん:2022/07/24(日) 15:31:28.02 .net
新しい入力・校正申請をどの程度にしてすればいいのか迷う……

92 :無名草子さん:2022/07/24(日) 18:21:39.94 .net
点検さんたちの底本の収集が難しい事情もわかるけれど
ボランティア側からすると
ステイホーム(半ば死語)な時勢だからこそ作業が捗るというのもあって

点検や校了、公開がかなり遅くなっても構わないから
作業受付だけはしてもらえないだろうか
と思ったりする

93 :無名草子さん:2022/07/24(日) 19:01:46.39 .net
作業受付自体は既に再開してるんだよね(下記参照)
問題は「複数の底本にわたる大量の入力・校正申請を控える」の「大量」がどれくらいを想定してるのか

2020年07月07日 受付・点検の制限付き再開のお知らせ(そらもよう)
https://www.aozora.gr.jp/soramoyou/soramoyou2020.html#000516

94 :無名草子さん:2022/07/24(日) 19:12:40.17 .net
そう、それなんです
作業状況ページを見ると、日々まとまった申請はあるようだけど
どれくらいを受け付けてもらえるかは
ボランティアさんのスキルにもよるのだろうかと考えたり

95 :無名草子さん:2022/07/24(日) 19:24:59.78 .net
ここでの問題って図書館に行って底本を確認出来ないことにあるから
底本の画像データも申請と同時に送れば大抵の申請は認められるのかもしれない

知らんけど

96 :無名草子さん:2022/07/24(日) 21:17:36.07 .net
Wikipediaの央端社の話を知ってふと思ったんだけど
実在しない本を捏造して入力する工作員(スパイ?)とかいるのかな

97 :無名草子さん:2022/07/24(日) 21:22:44.90 .net
そのための点検グループなんじゃないかな?

98 :無名草子さん:2022/07/24(日) 21:33:01.13 .net
でも今は入力者から送られてきた画像データを元に点検してるわけでしょ?
国立国会図書館サーチやCinii booksの検索に引っ掛からない本だって少なからずあるし、古い新聞や雑誌の記事ならGoogle検索すら厳しくなるから、場合によっては捏造でもバレない可能性が……
……とは言え愉快犯だとしても何が目的でそんなことするんだという疑問は当然あるけどね

99 :無名草子さん:2022/07/24(日) 22:12:42.67 .net
著作権者の権利問題がクリアできないと
(著作権者の実在性と、没後70年が確認できないと)
青空文庫としてのGOはでないと思う

それとも実在の作家の作品と称して捏造してもわからないんじゃないかって話?

100 :無名草子さん:2022/07/24(日) 22:43:16 .net
イメージとしては
「当時自分の地元に旅行に来ていた夏目漱石が地元の○○新聞に寄稿しているのを発見して、タイトルを調べると全集には未収録のようだから是非とも青空文庫に収録したい」
みたいな感じかな

流石に夏目漱石レベルの作家なら、未発見作品が実在するのか、本当に全集未収録作品か(初出不明で改題収録されてるだけではないか)とか、青空文庫とは別に研究家が検証するだろうけど
本格的な人物研究の伝記が出版されてなかったり、そもそも作品集の類が出版されてないレベルの人なら「マイナーな作家のマイナーな作品を入力してるねぇ」で済まされるんじゃないかと

一応言っておくけどあくまでも「もしかして気付けないのでは?」って話であって、これをして誰がどういう風に得するのかとかは考慮してないからね

101 :無名草子さん:2022/07/24(日) 23:26:28.21 .net
なるほどね。
もしかするとその意味もあってこれまで、
基本的に底本の確保は各自というルールがあったのかもね。

いやもちろん勝手な想像です。

102 :無名草子さん:2022/07/24(日) 23:37:33 .net
「そういえば」と言うほど関連してるか微妙だが坂口安吾の全集未収録作品が発見されたとかいうニュースがあったな
一昨年くらいだったと思って調べたら2018年だった

川端・安吾、埋もれた小説発掘 新聞に発表、全集未収録 あす発売「新潮」掲載:朝日新聞デジタル
ttps://www.asahi.com/articles/DA3S13388989.html

103 :無名草子さん:2022/07/25(月) 01:52:29 .net
>>93
他の工作員の動きも関わってくるので各々具体的に何作品までというと難しいですよね。
点検する側は確保すべき底本の冊数が増えると大変ということらしいので
1冊ずつ申請したほうがいいのは間違いないと思いますが

104 :無名草子さん:2022/07/25(月) 20:51:43.62 .net
昨日作業申請が通った量の膨大さにびっくり

105 :無名草子さん:2022/07/25(月) 20:54:28.75 .net
底本一冊の70作品以上の校正申請が一括で通ってるね
やはり底本をしぼることこそがポイントなのかな?

106 :無名草子さん:2022/07/25(月) 21:20:02.06 .net
【底本画像有】というのも大きいのかな?

107 :無名草子さん:2022/07/25(月) 21:31:04.09 .net
なるほど
校正完了時じゃなくて申請時に送ってしまうのか

108 :無名草子さん:2022/07/25(月) 21:32:56.01 .net
羨ましくてたまらない

109 :無名草子さん:2022/07/25(月) 21:55:39.08 .net
校正者も数年に渡って百数十作品の校正をしてるという実績がある人のようだね
経験の多さで申請受理の優先劣後の区分がされてるかどうかは知らないけど

110 :無名草子さん:2022/07/25(月) 22:02:59.98 .net
たしかに、経験豊富なボランティアさんなら
点検グループの負担はずいぶん軽減されるだろうね

111 :無名草子さん:2022/07/25(月) 22:30:35.23 .net
なんなら必要事項を説明すれば校正作業に加えて(一部の)点検作業も任せられるだろうしね

112 :無名草子さん:2022/07/25(月) 22:33:48.90 .net
>>111訂正追記

校正申請を受け付けてる時点で点検は終わってるか……

113 :無名草子さん:2022/07/26(火) 19:51:10.29 .net
そういや「江戸川乱歩」も同姓同名で作品書いてた作家がいるって話聞いたことあるなぁ
政治家の「吉田茂」も同姓同名で2人いたらしいし、青空文庫の登録上はどうなるんだろ?

114 :無名草子さん:2022/07/26(火) 19:51:36.62 .net
ハンセン病、もっと知って 国立療養所を小中学生が見学 | 共同通信
https://nordot.app/924562691536502784


北条民雄(1914-1937)の「いのちの初夜」は
ハンセン病を発病した北条が自信の入院直後を描いた作品

作家別作品リスト:北条 民雄
https://www.aozora.gr.jp/index_pages/person997.html

図書カード:いのちの初夜
https://www.aozora.gr.jp/cards/000997/card398.html

115 :無名草子さん:2022/07/26(火) 20:42:34.28 .net
>>113
同一作家での作品の名前被りは副題の所に作品の冒頭を〔〕で書いて区別してるっぽいけど、そうしてないのもあるし普通に載せるんじゃないの
どのみち名前だけじゃなく生没年や登録番号のデータでも管理してるはずだしね

116 :無名草子さん:2022/07/28(木) 17:09:48.78 .net
【文字認識】OCRソフト【 自炊 】 [無断転載禁止]©2ch.net
https://egg.5ch.net/test/read.cgi/software/1470745451/

117 :無名草子さん:2022/07/29(金) 19:39:25.97 .net
山本周五郎ってミステリーも書いてんの?!
知らんかったわ~

118 :無名草子さん:2022/07/30(土) 11:49:11.35 .net
芥川龍之介の手紙見つかる 友人で作家の佐藤春夫に送ったもの | NHK
https://www3.nhk.or.jp/news/html/20220729/k10013742861000.html

119 :無名草子さん:2022/07/31(日) 14:05:58 .net
『ごんぎつね』の読めない小学生たち、恐喝を認識できない女子生徒……石井光太が語る〈いま学校で起こっている〉国語力崩壊の惨状 | 文春オンライン
https://bunshun.jp/articles/-/55970

図書カード:ごん狐 (新美 南吉)
https://www.aozora.gr.jp/cards/000121/card628.html

120 :2022年8月公開予定作品一覧:2022/07/31(日) 18:00:03.32 .net
2022-08-01 佐藤 春夫『若き日の室生犀星』
2022-08-01 萩原 朔太郎『室生犀星君の人物について』
2022-08-01 室生 犀星『ふたりのおばさん』※誕生日
2022-08-02 三富 朽葉『水のほとりに』『ピアノ』※命日
2022-08-03 山本 周五郎『殺生谷の鬼火』
2022-08-04 木下 夕爾『晩夏』※命日
2022-08-05 壺井 栄『暦』『日めくり』※誕生日
2022-08-06 木下 夕爾『火の記憶 広島原爆忌にあたり』※広島原爆忌
2022-08-07 山本 周五郎『亡霊ホテル』
2022-08-08 柳田 国男『かはたれ時』『狸とムジナ』※命日
2022-08-09 作者不詳『現代語訳 平家物語 08 第八巻』
2022-08-10 山本 周五郎『天狗岩の殺人魔』
2022-08-11 中谷 宇吉郎『八幡馬と墨の研究』
2022-08-12 山本 周五郎『劇団「笑う妖魔」』
2022-08-13 古川 緑波『売薬ファン』※誕生日
2022-08-14 三富 朽葉『深夜』『メランコリア』※誕生日
2022-08-15 釈 迢空『鵠が音 03 追ひ書き』

121 :2022年8月公開予定作品一覧:2022/07/31(日) 18:00:30.83 .net
2022-08-16 津田 梅子『女教邇言』※命日
2022-08-17 山本 周五郎『花咲かぬリラ』
2022-08-18 ホワイト フレッド・M『ドレントン・デン特派員の冒険 02 第二回 赤い斑点』
2022-08-19 永井 荷風『虫の声』
2022-08-20 山本 周五郎『海浜荘の殺人』
2022-08-21 中谷 宇吉郎『永久凍土地帯』
2022-08-22 山本 周五郎『水中の怪人』
2022-08-23 坂口 安吾『選後感〔第二十七回芥川賞選後評〕』
2022-08-24 若山 牧水『沼津千本松原』※誕生日
2022-08-25 山本 周五郎『廃灯台の怪鳥』
2022-08-26 平野 零児『丹波篠山』※命日
2022-08-27 山本 周五郎『流血船西へ行く』
2022-08-28 岡本 かの子『花子』
2022-08-29 山本 周五郎『鵜』
2022-08-30 中谷 宇吉郎『紙の洪水』
2022-08-31 山本 周五郎『月の松山』

122 :2022年8月公開予定作品一覧:2022/07/31(日) 18:18:50.08 .net
【訂正】
どれくらい皆の興味の対象か知りませんが、
先月から「作品初公開」の注釈付け足すことにしたの忘れてました。

2022-08-02 三富 朽葉『水のほとりに』『ピアノ』※命日、作品初公開
2022-08-04 木下 夕爾『晩夏』※命日、作品初公開
2022-08-16 津田 梅子『女教邇言』※命日、作品初公開

123 :無名草子さん:2022/07/31(日) 19:44:29.99 .net
松本清張が青空文庫入りするまであと40年か
生きてるかなおれ

124 :無名草子さん:2022/07/31(日) 20:11:13.15 .net
いい作品を読むと感動の次にすぐ
この本を入力公開できる日を自分が迎えられるか考えちゃう自分がいる

125 :無名草子さん:2022/07/31(日) 20:16:07.05 .net
俺の目の黒い内に星新一の作品を入力出来る日は来るのだろうか

126 :無名草子さん:2022/07/31(日) 20:21:53.11 .net
無理じゃね

127 :無名草子さん:2022/07/31(日) 20:32:18.69 .net
太宰治とか中島敦とか青空文庫入りしてるのに生年では彼らより以前の
井上靖が入ってなくてお前とっとと死んどけよなんて一瞬思ったけど
そうなるとそもそも井上靖の作品全てが読めなくなるわけで
申し訳ありませんでしたって即座にあやまったわ。

128 :無名草子さん:2022/07/31(日) 20:35:22.01 .net
「目の黒いうち」の使い方マチガッテル

129 :無名草子さん:2022/07/31(日) 20:53:44.60 .net
目の黒い内に=生きている内に
だから別に間違ってないでしょ

目の黒い内とは - コトバンク
https://kotobank.jp/word/%E7%9B%AE%E3%81%AE%E9%BB%92%E3%81%84%E5%86%85-396433

130 :無名草子さん:2022/07/31(日) 20:57:46.02 .net
>>127
逆に自殺とか不慮の事故や災害で早世した人って現在で傑作だと評価されている作品よりも優れた作品を書き上げることなく亡くなった可能性があるんだよな

131 :無名草子さん:2022/07/31(日) 21:19:54.15 .net
自分の目の黒いうちに世界一周旅行したい

俺の目の黒いうちはそんなことはさせない

上のような使い方は変だよ

132 :無名草子さん:2022/07/31(日) 21:35:39.97 .net
それは単に下の(拒絶や否定などのマイナスイメージを彷彿とさせる)言い回しの時に聞き馴染みがある慣用句だからそう感じるだけでしょう

「全然」は否定を伴う副詞だと勝手に思ってるようなもの

133 :無名草子さん:2022/07/31(日) 22:14:36.10 .net
古い作品を読んでると言葉の意味を間違って使ってるのかなってのが結構ある
んで調べるとそれもありらしいってわかる

134 :無名草子さん:2022/07/31(日) 22:20:44.19 .net
そうそう、入力校正してると特に

135 :無名草子さん:2022/08/01(月) 19:21:22.73 .net
>>125
ショートショートなら山川方夫さんがあるぞ

136 :無名草子さん:2022/08/01(月) 21:54:38.68 .net
山川方夫さんのショートショートも勿論とても良いが
独特のSF風味の強い、しかも先見の明ある星新一さんの世界観を青空文庫で見たい気持ちはわかる

137 :無名草子さん:2022/08/04(木) 21:11:25 .net
【新文化】 - 最新号(22年8月4日号)案内:日販王子DC、トラック待機時間30分以内に/注文品トラック予約システム導入/ESGの取組みで実効/CO2削減量年間10トン《1面特集》
https://www.shinbunka.co.jp/saishin.htm


>最終面特集は、【インターネット図書館「青空文庫」の25年/著作権切れ&著者が公開同意した作品/1万7000点以上を登録・公開】

>著作権の保護期間を過ぎた著者の作品を電子化して公開するインターネット上の図書館「青空文庫」がこの7月、開始から25年を迎えた。
>登録作品数1万7000点以上にのぼり、パソコンのほかスマホや電子書籍リーダーなどで読まれるとともに、商業出版や朗読に利用されている。
>この青空文庫の立ち上げの経緯から現状、今後の展望について関係者に取材した。(南陀楼綾繁)

138 :無名草子さん:2022/08/05(金) 09:36:33.97 .net
ん、梅ちゃん先生か

139 :無名草子さん:2022/08/05(金) 12:17:02.22 .net
こんな新聞があるんですね.
面白そう.昨年度縮刷版を買おうかと思ってしまいました.
読む時間なさそうなので買いませんけど.

140 :無名草子さん:2022/08/05(金) 12:32:37.74 .net
「新聞?」って思ったけど雑誌じゃなくて新聞(業界紙)という扱いなのね

141 :無名草子さん:2022/08/06(土) 01:01:49.56 .net
コンビニのコピー機で専門紙を印刷して読めるなんて初めて知りましたわ

142 :青空文庫アクセスランキング:2022/08/06(土) 20:54:22.91 .net
2022年7月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_07_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_07_txt.html

143 :aozorablog:2022/08/07(日) 00:15:54.49 .net
青空文庫’22/06月-’22/07月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5076

144 :無名草子さん:2022/08/24(水) 17:20:37.47 .net


145 :無名草子さん:2022/08/24(水) 23:02:18.40 .net
スキャナーが古いせいで入力作業よりスキャンに時間がかかってる気がする

146 :無名草子さん:2022/08/25(木) 22:07:53.76 .net
>>145
自分もスキャナーだとたまに読み込みが遅かったり不具合が出るから、急ぎで入れたい時はスマホ使ってる

147 :無名草子さん:2022/08/25(木) 23:17:07.29 .net
分厚くてあまり貸し出しがない全集ものだと
本がしっかり開かなくてノドが影になるし
文字も読み取りにくいからCCDスキャナー買った

でもそうか、スマホを使うという手があったね

148 :無名草子さん:2022/08/25(木) 23:54:08.86 .net
本→スキャン
よりも
本→コピー(画質調整あり)→スキャン
の方が古い本のシミとか分厚い本のノドとかがマシになる

まぁ特に理由がない限りはスマホ直撮りでも良いんだが
(青空文庫に送る時はPDF化とかしなくてもスマホのデータでも良いと言ってるし)

149 :無名草子さん:2022/08/29(月) 19:51:55.21 .net
入力中 で何年も作業状況が止まっている作品って
ほんとうに入力者が投げ出しているものもあるかもしれないけれど
入力は終わっていて青空文庫に納品されてるけど
点検の人手が足りなくて「校正待ち」になれないものが実は多いんじゃないかという希ガス

150 :無名草子さん:2022/08/29(月) 20:00:25.28 .net
「校正待ち(点検前)」という作業状態が設けられてるからそれはないんじゃなかろうか

151 :無名草子さん:2022/08/29(月) 20:51:53.39 .net
校正待ち(点検前)はそういう意味ではないと思う
入力ファイルが古く、現行の注記ルールに倣っていないもののこと

152 :無名草子さん:2022/08/29(月) 20:54:13.21 .net
と、校正待ち検索のサイトに書いてあったと思う

153 :無名草子さん:2022/08/29(月) 21:36:05.89 .net
とは言っても近年でも使われてるからな
(単純な入力ミスの可能性もあるけど)

青空文庫 作業中作品リスト:校正待ち(点検前) 2022年
https://yozora.main.jp/cgi-bin/inp/sagyo.cgi?s=4&y=2022

154 :153:2022/08/29(月) 22:32:15.10 .net
ちょっと語気が強いような書き方になってしまった
申し訳ない

155 :無名草子さん:2022/08/29(月) 23:38:13.61 .net
ほーう参考になるありがとう

156 :2022年9月公開予定作品一覧:2022/08/31(水) 18:59:03.73 .net
2022-09-01 佐藤 春夫『サーベル礼讃』※関東大震災
2022-09-02 山本 周五郎『蘭』
2022-09-03 木下 夕爾『新秋の記』
2022-09-04 山本 周五郎『柘榴』
2022-09-05 吉江 喬松『海潮の響』※誕生日
2022-09-06 山本 周五郎『合歓木の蔭』
2022-09-07 泉 鏡花『浅茅生』※命日
2022-09-07 平野 零児『吉川さんの声と眼』※吉川英治命日(英治忌)
2022-09-08 山本 周五郎『山椿』
2022-09-09 作者不詳『現代語訳 平家物語 09 第九巻』
2022-09-10 田山 花袋『中秋の頃』※中秋(旧暦8月15日)
2022-09-11 山本 周五郎『女は同じ物語』
2022-09-12 中谷 宇吉郎『ツンドラへの旅』
2022-09-13 山本 周五郎『しじみ河岸』
2022-09-14 小泉 八雲『おしどり』
2022-09-15 山本 周五郎『初夜』

157 :2022年9月公開予定作品一覧:2022/08/31(水) 18:59:39.38 .net
2022-09-16 大杉 栄『お別れ』※命日
2022-09-16 菊池 寛『競馬の一日に就いて』※競馬の日
2022-09-17 山本 周五郎『みずぐるま』
2022-09-18 ホワイト フレッド・M『ドレントン・デン特派員の冒険 03 第三回 放火団』
2022-09-19 田山 花袋『水源を思ふ』
2022-09-20 山本 周五郎『豹』
2022-09-21 中谷 宇吉郎『墨流しの物理的研究』
2022-09-22 山本 周五郎『蕗問答』
2022-09-23 坂口 安吾『花田清輝論』※花田清輝命日
2022-09-24 山本 周五郎『溜息の部屋』
2022-09-25 寺田 寅彦『卵の形』
2022-09-26 小泉 八雲『術数』『無法な火葬』※命日(八雲忌)
2022-09-27 山本 周五郎『城中の霜』
2022-09-28 永井 荷風『独居雑感』
2022-09-29 山本 周五郎『柿』
2022-09-30 中谷 宇吉郎『墨並びに硯の物理学的研究』

158 :無名草子さん:2022/09/02(金) 17:17:14.74 .net
>>149
「校正待ち」の日付には、基本的に入力者が提出した日が入っているはずで、
よっぽど底本確認が大変なもの以外で点検で何年も遅れているのはなさそう
初作業の人のファイルは優先的に進めてくれるし

初作業でそのまま投げ出してる人は多い
入力は別にいいけど、校正は当たった入力者が気の毒だなと思っている

159 :無名草子さん:2022/09/02(金) 17:28:34.96 .net
>>158

とてもやりとげられないと思ったら遠慮なく、と言ってくれてはいるが
やりとげるも何も作業者がそのまま忘れているケースも中にはあるんだろうな

動きがないまま二年経ったら引き継ぎ申請していいんだっけ

入力はともかく、校正は二年経ったら自動でシステムから進捗問い合わせメールが届くようになってたら
忘れてた人も思い出してくれたり、できないなら取消申請してくれるいいきっかけとタイミングになると思うから嬉しいのだけど

160 :無名草子さん:2022/09/02(金) 19:33:11.59 .net
普通に2年以上放置してるわ
まだ1章まで(全体の1割未満)しか校正してない

すまん

161 :無名草子さん:2022/09/02(金) 19:36:56.28 .net
>>160
単純計算で、20年計画で草。

162 :無名草子さん:2022/09/02(金) 20:28:54.35 .net
>>161
1日1ページやれば1年以内に終わるはずだったが「やったー1章まで終わったー」あたりで止まってしまった
(運営側から校正者変更の打診は来てないのでどちらにせよ公開が本来より遅れたということにはなってないと信じたい)

逆に邪魔かもしれんが校正意欲は一応まだ持ってる

163 :無名草子さん:2022/09/02(金) 20:38:55.09 .net
応援してる∩(´∀`∩)

164 :無名草子さん:2022/09/02(金) 23:01:09.15 .net
一通り校正するのに1年かかるという意味なら300ページを超えるし、校正は4回やるということを混みで1年としても100ページ近いことになる
入力にせよ校正にせよ全集の片隅に載ってるような数ページの短編でもヒーコラ言ってる身としては申請するだけでも凄いと感じる

165 :無名草子さん:2022/09/03(土) 10:27:36.35 .net
ちょっとずつコツコツやろうってのが間違いの元
むしろある程度集中して一気にやったほうがやれる

166 :無名草子さん:2022/09/03(土) 12:55:00.34 .net
たしかに。

167 :無名草子さん:2022/09/03(土) 13:08:27.06 .net
>>165
本1冊レベルの分量になると話は変わるのかもしれんが
基本的にはマジでこれだと思う

168 :無名草子さん:2022/09/04(日) 02:36:12.13 .net
作業着手連絡システムの自動応答メールが来ないな

169 :無名草子さん:2022/09/04(日) 02:45:57.29 .net
>>168
そらもよう(>>81)で少し触れてたけどgmailなら多分届かない

170 :無名草子さん:2022/09/04(日) 11:17:22.92 .net
長年の校正待ちの中にある
南洲手抄言志録 00 題字(山県有朋)
っていうのはほんとうに題字だけなんだろうか

本文のほうはすでに公開されているようだが

171 :無名草子さん:2022/09/04(日) 13:55:15.50 .net
よく分からんが校正受付システムのデータベースではサイズが288,664バイトとなってるな

底本見てもそんなことないと思うけど
https://dl.ndl.go.jp/info:ndljp/pid/756228

172 :無名草子さん:2022/09/04(日) 17:45:28.91 .net
>>169
ありがとう
そらもよう読んでたけど先月まで届いてたから油断してた

173 :無名草子さん:2022/09/04(日) 18:03:17.03 .net
>>171
そのバイト数の見方はいつも正直良く解らんのだが
画像込みなんだろうか?
テキストだけで36メガあるようには思えぬが

というか
NDL見たが、これどう校正したらいいのww

174 :無名草子さん:2022/09/04(日) 18:58:45.76 .net
>>173
バイト数は単純にテキスト・ファイルとしての容量じゃないの?

多分「感慨係之矣/明治廿年六月/有朋題」って書いてるから
そう書いてるかどうかだけ確認する簡単なお仕事な気がする
(一部の漢字は外字注記にしてる気もするけど)

175 :無名草子さん:2022/09/04(日) 19:23:28.45 .net
あ、ほんとだKBだったw

176 :無名草子さん:2022/09/04(日) 19:37:41.13 .net
(*ノ▽ノ)はずかしい

177 :無名草子さん:2022/09/04(日) 22:26:37.89 .net
【文学は大人の教養!】初心者が青空文庫検索Botを作った - Qiita
https://qiita.com/kunimuraM/items/776318bc630a8ad964b1

178 :青空文庫アクセスランキング:2022/09/05(月) 07:49:38.34 .net
2022年8月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_08_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_08_txt.html

179 :無名草子さん:[ここ壊れてます] .net
狂ったように山周ばっかなのはなじぇ?
銭平やってほしい

180 :無名草子さん:[ここ壊れてます] .net
入力する人と校正する人がいるから

181 :無名草子さん:2022/09/06(火) 10:13:19.32 .net
山があるからみたいなw

182 :無名草子さん:2022/09/06(火) 19:28:03.95 .net
甲「なぜ公開されるんですか?」
乙「そこに校了作品があるから」

たしかに

183 :aozorablog:2022/09/07(水) 07:52:29.60 .net
青空文庫’22/07月-’22/08月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5087

184 :無名草子さん:2022/09/07(水) 08:18:37.37 .net
テキスト版新規公開作品一日当たりアクセス数ランキング
1位から11位まで山本周五郎が独占、流石だな
>>179 需要があるのだよ

185 :無名草子さん:2022/09/07(水) 18:40:13.59 .net
(200超過アクセス/日)

200を一律に引いているのは何故?

表示テストその他で、どの作品も200程度はアクセス数から差し引く必要があるということ?

186 :無名草子さん:2022/09/07(水) 21:49:18.33 .net
俺も気になってたのでちょうどいい機会だから過去のブログを調べてみた。
公開日のズレを埋めて比較できるようにと2013年頃に試行錯誤した結果っぽいね。

>公開日が新しい作品ほどランクが上位にあるから、一日あたりのアクセス数というのは、実はあまり良い指標ではないのかもしれない。
青空文庫’13/04月-’13/05月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2221

>新規公開作品は一日当たりアクセス数という指標の計算方法がどうも適切でないようなので、該当作品のアクセス数から500位のアクセス数を引いたアクセス数を公開日からの日数で割った値で順位付けしてみた。
青空文庫’13/05月-’13/06月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2264

>ランキングの指数としている超過分アクセス数/日は、またまた計算方法を変えて、該当作品のアクセス数からアクセス数200を引いたアクセス数を公開日からの日数で割った値とすることにした。
>毎月、ベースの数値を変えるのは遷移を考える際に難しいと思ったからである。
青空文庫'13/07月-'13/08月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=2337

187 :無名草子さん:2022/09/08(木) 01:02:51.15 .net
なるほどなぁ。

>公開日が新しい作品ほどランクが上位にあるから

どの作品も公開直後はアクセスが集中する(いわばボーナスタイム)であるから、
月の初めに公開された作品の30(31)日と
月の終わりに公開されたボーナスタイムのみの作品の数日とでは
「一日の重みと意味」が違うであろう、ということか。

9年以上この200アクセスを引く計算式で落ち着いているということは、
統計的におおむね200アクセス程度が、
ボーナスタイムに得られるアクセス数の平均値ということなんだろうな。

今度から注目してみよう。

>>186 ありがとう。

188 :無名草子さん:2022/09/08(木) 08:05:33.51 .net
漱石ばっかり読んでるオレ
全く進歩なし
それも猫ばっかり

189 :無名草子さん:2022/09/08(木) 08:28:30.95 .net
タダで読めるとこでもなんか既読のばっかり読んじゃうってあるな…

190 :無名草子さん:2022/09/08(木) 11:17:59.17 .net
青空文庫ブラウザで、既読の作品にはチェックマークがつけられるようなのあったら使いたい

自分はコンプリート欲が強いので、コンプ経過が目に見えるとうれしくなる

191 :無名草子さん:2022/09/08(木) 11:26:26.30 .net
親譲りの無鉄砲な猫の夢を見た。

192 :無名草子さん:2022/09/08(木) 13:11:58.46 .net
私はその人の事を先生とよんでいる

だったっけ?

193 :無名草子さん:2022/09/08(木) 23:35:26.97 .net
aozorablog、初期の頃はアクセス分析以外にも色々書いてたんだね

194 :無名草子さん:2022/09/12(月) 21:25:36.52 .net
(´・ω・`) アオゾラ ウンコ

195 :無名草子さん:2022/09/12(月) 22:10:12.82 .net
(´・ω・`) アオゾラ チンコ

196 :無名草子さん:2022/09/12(月) 22:49:27.97 .net
青空ウンコ・チンコ

197 :無名草子さん:2022/09/12(月) 23:40:27.44 .net
無料

198 :無名草子さん:2022/09/13(火) 08:21:13.38 .net
隙あらば山周、時々中宇でウケル(´・ω・`)

199 :無名草子さん:2022/09/13(火) 23:28:56.53 .net
やっぱり校正者が出てくるのが強い

200 :無名草子さん:2022/09/14(水) 21:00:38.94 .net
結局そこにかかってくる

201 :無名草子さん:[ここ壊れてます] .net
1の壁…収録したい作品の著作権保護期間が満了している
(※原則として、個人は著作者の死後70年、無名/変名/団体名義は公表後70年。
 ただし、1967(昭和42)年12月31日以前に死亡/公表している場合は保護期間満了済み。
また、本文の著者だけでなく、編集や校訂、翻訳などをした人の没年も必要に応じて要確認)

2の壁…入力者が存在する

3の壁…校正者が登場する


1の壁も法改正のせいで最近高くなったし色々確認する必要があるんだけど、文章にすると滅茶苦茶シンプルな2と3の壁(特に3の壁)が高すぎるんだよな

俺も入力した作品がいくつ校正待ちのままになっているか……

202 :無名草子さん:2022/09/15(木) 04:21:08.31 .net
今日も山周・・・(´・ω・`)

203 :無名草子さん:2022/09/15(木) 12:09:32.91 .net
「嫌なら読むな」じゃなくて「嫌なら工作員になれ」だな

204 :無名草子さん:[ここ壊れてます] .net
山本周五郎、公開作品数160で21位か(6作品が今月公開予定なので今月中に20位になる)
パブリックドメインになった時期が遅いことを考えるとやっぱり人気なんだろうな

青空文庫 公開中の作品数(作家別)一覧
https://yozora.main.jp/inp/klist1.html

205 :無名草子さん:2022/09/15(木) 22:39:04.26 .net
2018年から4年足らずで160作品ということになるから毎年40作品以上公開されてるのか
山本周五郎の波を止めたいなら別の作家で年間40作品以上の作業をしなければならない

206 :無名草子さん:2022/09/15(木) 23:13:57.42 .net
それは公開中の作品数だけの話だしな。

水面下(作業中)はそんなのメじゃない数の山周作品が進行している。

あれほどの数を作業進行中にできるかっていうとなかなか

207 :無名草子さん:2022/09/15(木) 23:16:29.96 .net
実際のところ、青空文庫における山周ムーブメントには
富田倫生さんの遺志を残された者たちが継ぐ!という意識が関係していると思う?

208 :無名草子さん:2022/09/15(木) 23:27:25.58 .net
山本周五郎の作品が公開された時に作品名でググると青空文庫公開前からアップロードされてる朗読動画とか出てくるし普通に人気なんだと思う

もっとも公開/作業中の作品の入力者や校正者を見ると数人が大量に作業してるっぽいから中にはそう考えて頑張ってる人もいるかもしれないけど

209 :無名草子さん:2022/09/15(木) 23:38:43.08 .net
>>201
自分は校正やりたいマンなんだけど
このご時世も手伝ってなかなか申請が進まないでいる。

頑張るから待ってて。

210 :無名草子さん:2022/09/16(金) 00:08:01.31 .net
青空文庫校正待ち作品検索(※何故かURLが貼れない)の原稿用紙換算の数字が1桁の作品を片っ端から校正すれば、少ない負担で山周ムーブメントに待ったをかけられるかもしれない

211 :無名草子さん:2022/09/16(金) 01:15:52.33 .net
校正は公開に直結するのが魅力だね
他者の作業を見るわけだから勉強にもなるし

212 :無名草子さん:2022/09/16(金) 09:16:04.03 .net
明日も山周・・・(´・ω・`)

213 :無名草子さん:2022/09/16(金) 12:30:08.25 .net
入力者校正と点検を経てなお残る誤字って、要するに見落とされやすいということだから、今後自分が入力者校正する際に注意する指標が増やせる

214 :無名草子さん:2022/09/16(金) 12:34:24.86 .net
20日も山周・・・(´・ω・`)

215 :無名草子さん:2022/09/16(金) 12:47:57.60 .net
>>213
なるほど、我がふり直せ的な良い視点。

……とはいえ具体的には思い浮かばないな、
よくあるものでいえば注記漏れだろうか

216 :無名草子さん:2022/09/16(金) 19:04:03.27 .net
経験則だと

・当用漢字の変換ミス(例:「游泳」が「遊泳」、「熔岩」が「溶岩」になってる)
・濁点と半濁点の間違い(例:「びっくり」が「ぴっくり」になってる)
・門構えの中(例:「時間」が「時問」や「時聞」になってる)

あたりがパッと思い付くかな
最後のはほぼ確実にOCRを介してる入力だろう

217 :無名草子さん:[ここ壊れてます] .net
三連休でいくつか校正を終わらせたいなぁ

218 :無名草子さん:2022/09/17(土) 00:23:23.48 .net
左翼爺の宮本百合子ちゃんラッシュは終わったね

219 :無名草子さん:2022/09/17(土) 00:37:25.82 .net
短篇の入力1件終えたー
いつか校正者さまの降臨がありますように!

220 :無名草子さん:[ここ壊れてます] .net
>>218
マイナーだけどプロレタリア系だと中野鈴子が大量校了してるから、そのうちラッシュ来るで

221 :無名草子さん:[ここ壊れてます] .net
保守主義的な作品を入力してバランスを取るか(?)

222 :無名草子さん:2022/09/17(土) 02:22:52.99 .net
作品の内容や著者でフィルターをかけることは青空文庫の趣旨にもとるわけだが、
あまりにもイデオロギー色が強く出過ぎた作品のラッシュが続くと
(保守、リベラルにかかわらず)
青空文庫自体がそういう思想団体と思われそうで、愉快ではない

223 :無名草子さん:2022/09/17(土) 02:29:09.25 .net
だからこそ「著作権切れてるかどうかだけが判断基準なんだな」と思われるようにしなければならない(?)

まぁマジな話をすると興味の皆無な分野の作品にモチベーション沸く気がしないから申請しないけど

224 :無名草子さん:2022/09/17(土) 02:49:10.55 .net
昔は芥川の比率が高すぎて芥川文庫とか呼ばれてたんだっけ

ワイの入力したマイナー作家も誰か大量校正しちくり~

225 :無名草子さん:2022/09/17(土) 08:35:21.11 .net
隙あらば山周、時々中宇予報


2022-09-20 山本 周五郎『豹』
2022-09-21 中谷 宇吉郎『墨流しの物理的研究』
2022-09-22 山本 周五郎『蕗問答』
2022-09-24 山本 周五郎『溜息の部屋』
2022-09-27 山本 周五郎『城中の霜』
2022-09-29 山本 周五郎『柿』
2022-09-30 中谷 宇吉郎『墨並びに硯の物理学的研究』

226 :無名草子さん:2022/09/17(土) 09:12:19.88 .net
校正したい作品がずっと校正待ち(点検前)になってる
どうしたら?

227 :無名草子さん:2022/09/17(土) 09:30:03.09 .net
>>226
校正申請すれば点検してくれるよ
底本画像を送っとくと早い

228 :無名草子さん:2022/09/17(土) 11:19:27.49 .net
校正待ち(点検前) : 790件 (内訳)
校正待ち(点検済み) : 1,959件 (内訳)

内訳見たら最近は減ってるっぽいが割とあるのね

229 :無名草子さん:2022/09/17(土) 13:50:56.62 .net
校正申請があるその時その時に点検をしてると折角の校正が中々始められなくなる(その分公開も遅れる)というデメリットがあるんだろうけど
早い内に点検までしてくれたのに何年も校正待ちのままっていうのも悲しいね

230 :無名草子さん:2022/09/17(土) 14:50:56.39 .net
>>224
作家名晒しちゃおう

231 :無名草子さん:2022/09/17(土) 16:18:41.75 .net
宮本百合子はウヨサヨ関係なくすごい作家じゃないか?
佐多稲子のほうが上だとは思うが

232 :無名草子さん:2022/09/17(土) 21:29:58.10 .net
ふと思ったけど、耕作員のフォーラムみたいなものって存在しないよね。

とくに青空文庫が出来た頃はインターネット黎明期で、
「ホームページ」に設置の掲示板でやり取りするのがスタンダードだった時代

少数精鋭ではじめた当時にはそういうものがあったのかあるいは無かったのか知らないけれど、
どうして無いのだろう?と思った。

それなりに大きい組織の統制のためだろうか?

233 :無名草子さん:2022/09/17(土) 21:32:31.03 .net
たとえば
点検グループでない者が私見で指導したり可否を談じたりすることがないように、
相談事の生じるであろう場は作らないとかの。

234 :無名草子さん:2022/09/17(土) 21:57:18.14 .net
青空文庫の掲示板や情報交換フォーラムは「みずたまり」とか「よぞら」とか「こもれび」とか「むしとりあみ」とか「AOZORAX」とか色々あったんですよ……

235 :無名草子さん:2022/09/17(土) 22:17:09.52 .net
なんでなくなったの?

236 :無名草子さん:2022/09/17(土) 22:42:27.42 .net
その疑問こそが答えでは

237 :無名草子さん:2022/09/17(土) 22:50:59.58 .net
aozorahack に参加したいなんて思ってたけど
github も動いてないしどうしたものか。

前にも言ったことあるけど青空文庫のテキストを
sjisからutf8とかにすると使える漢字が増えて
注釈を減らせるしホームページにそのまま載せれるし
メリットが大きい(と思う)。

移行しない理由が作業が大変ってだけなら
一発変換のスクリプトとか提供できるのに。

238 :無名草子さん:2022/09/18(日) 00:10:45.48 .net
>>236
よくわからんが、

「自治厨が、私見で間違った指導」
「運営を差し置いた相談事とその決定」
「フォーラム乱立によるローカルルールの発生、ひいては作業ルールに対する解釈のブレ」

そして
「そうしたトラブルや不都合を防ぐためには、点検グループの中の人のように公式な管理者を常駐させる必要がある」→肝心の点検作業に差し支えるようになる

といったような解釈で良いのかな?

昔はそんなにあったんだね……フォーラム。
それがどれも存続してないという結果が全てな感じがする。

239 :無名草子さん:2022/09/18(日) 00:12:19.95 .net
>>237
すごい

240 :無名草子さん:2022/09/18(日) 00:44:14.59 .net
昔のそらもよう調べたら掲示板とかについても触れてるよ

241 :無名草子さん:2022/09/18(日) 01:34:03.40 .net
それが答えって知名度的な意味?

242 :無名草子さん:2022/09/18(日) 08:49:05.19 .net
>>237
一括置換で済めばいいけど、底本尊重だから、これまで包括判定していた漢字を底本に戻って確認しなきゃならないみたいな文を読んだ気がする

243 :無名草子さん:2022/09/18(日) 09:47:16.13 .net
なるほどなあ。

であればこそ、いまの「空白の(著作権消滅待ちの)20年」の間に
utf8化に向けてできることがありそうな気がするが……

包摂文字をマークアップするプログラム組んで、
底本再確認の負担を減らせないかとか……

まあ、言うは易しなのだろうな

244 :237:2022/09/18(日) 11:30:03.80 .net
ruby を使ったスクリプトで半年ほど前に作りました
バッチファイル自体は三十数行の短いものです
いくつか課題があったはずですが詳しくは忘れました

・文字をsjisからutf8に変換する
・ユニコードのコード表と注記の番号を照合し取り込み可能な漢字を取り込む
・バッチファイルをダブルクリックすると処理を開始
・バッチファイルのあるフォルダ以下のテキストファイルを加工し、バックアップをとる
というものです。以下に置いてあるので興味のある方は試して見て下さい

ttp://pansy.s1010.xrea.com/2022/03/05/sjis%e3%81%8b%e3%82%89utf8%e3%81%ab%e5%a4%89%e6%8f%9b/

245 :無名草子さん:2022/09/18(日) 11:52:35.79 .net
いっそウィキソースとかに置いたほうがいいのかもな

246 :無名草子さん:2022/09/18(日) 13:07:32.39 .net
「えあ草紙」や「ソラリ」みたいに外字注記を自動でUnicodeに置き換えてくれるアプリがすでにあるよね。
個人的にはそれで充分だから青空文庫本体の元データまでUnicodeに移行すべきとは思わないな。

247 :無名草子さん:2022/09/19(月) 11:53:35.55 .net
>>244
すごい

aozorahackはいま稼動していないのか

248 :無名草子さん:2022/09/19(月) 16:21:01.92 .net
aozorahackって経常的に活動してるの?

249 :無名草子さん:2022/09/20(火) 18:21:31.81 .net
藤沢周平が青空文庫に登場するまで長生きしたい。

250 :無名草子さん:2022/09/20(火) 18:29:40.44 .net
立川市図書館が日本トップレベルの電子図書館に!東京立川こぶしロータリークラブが青空文庫500タイトル・電子伊能図を寄贈、市内の小中学生を対象にレビュワー大賞も開催!|東京立川こぶしロータリークラブのプレスリリース
https://prtimes.jp/main/html/rd/p/000000002.000011282.html

251 :無名草子さん:2022/09/20(火) 18:40:44.29 .net
柳田国男の炭焼日記とか戦争中に書いていた日記を追加してくれ
ぜひとも読んでみたい

252 :無名草子さん:2022/09/20(火) 20:20:55.96 .net
>>251
入力したら校正担当してくれるって事か?

253 :無名草子さん:2022/09/21(水) 21:19:16.65 .net
Twitterで「#青空特務司書」や「#広がれ特務司書工作員の輪」の工作員交流用ハッシュタグがあるけど余り使われてないね

254 :無名草子さん:2022/09/21(水) 21:43:54.62 .net
>>251
古川ロッパの日記が校正待ちになってるなぁ

255 :無名草子さん:2022/09/22(木) 07:28:45.47 .net
>>253
文アル齧ってるけどなかなか交流はし辛い

256 :無名草子さん:2022/09/22(木) 08:59:11.96 .net
がっきぅう うんこ
てやったよな?

257 :無名草子さん:2022/09/22(木) 09:21:00.88 .net
ガッキーうんこなんて暴言は許せん

258 :無名草子さん:2022/09/22(木) 11:39:32.00 .net
>>255
文アル知らないけど、特務司書の名を借りてるだけで文アル関係なさそうじゃない?

まあ見つけにくいタグではあるよなぁ、耕作員用のタグないかな?と思った人が見つけられる名前ではないな。

校正依頼PRもできて、上手く使えば便利そうなのに

259 :無名草子さん:2022/09/22(木) 18:10:59.29 .net
稲垣足穂が1冊も登録されてないように見えるんだけど
この方の小説ものすごく良いのにもったいない

260 :無名草子さん:2022/09/22(木) 18:55:49.35 .net
入力しろ定期

261 :無名草子さん:[ここ壊れてます] .net
入力しても良いんですか?
そのための小説を僕にください
まさかここ10年で小説がこんな高騰するなんて思わなくて
断捨離してほぼ全て捨てたんだよ
なんで1200円とかするのよ

262 :無名草子さん:2022/09/22(木) 20:06:01.03 .net
没後50年すら経ってない作家なのか
ひとつも登録がないとかあたりまえの話じゃないか
出直して来い

263 :無名草子さん:2022/09/22(木) 20:07:26.43 .net
半年ROMれ

264 :無名草子さん:2022/09/22(木) 20:08:15.64 .net
1977年10月25日没って改正前ですら2023年1月1日からじゃん

265 :無名草子さん:2022/09/22(木) 20:09:09.04 .net
>>264
2023年じゃなくて2028年だわ

266 :無名草子さん:2022/09/22(木) 20:10:40.76 .net
それな

青空文庫を、乞食の巣窟にはしたくないものだ

267 :無名草子さん:2022/09/22(木) 21:15:58.87 .net
>>265
そうだったか
皆ありがとう
一千一秒物語好きだから注文した

268 :無名草子さん:2022/09/22(木) 21:33:29.98 .net
著作権切れの官能小説って無いん?
広義でじゃなくて、もうひたすら抜け!って感じの

269 :無名草子さん:2022/09/22(木) 21:47:08.42 .net
墨東綺譚がそんな感じかと思ってたのに期待してたのと違った

270 :無名草子さん:2022/09/22(木) 22:39:23.58 .net
Wikipediaの官能小説のページには

>近代的な小説のジャンルとして、読者の性欲を刺激することを目的に据え、性愛を描いた作品は明治時代から存在した。

とあるけど具体的な作品名は殆んど出されてない

271 :無名草子さん:2022/09/22(木) 22:55:02.05 .net
別に著作権保護期間が法改正で70年に延長されたの知らなくてもいいよ
それこそ知的財産権に関わらないなら何年間かも知らなくても別にいいよ
でも青空文庫にあるかどうか確認するならせめて自分で調べようよ

272 :無名草子さん:2022/09/22(木) 23:14:48.14 .net
>>271
それらしいレスだが既に終わった話題を蒸し返すのはださい

273 :無名草子さん:2022/09/22(木) 23:18:04.59 .net
戦中戦後の作品なら
××を×って××××たり×××××××
みたいな伏せ字で妄想がはかどるぞ。

274 :無名草子さん:2022/09/22(木) 23:26:55.26 .net
NDLのデジコレをそれらしい単語で検索すると性生活や性教育についての本は山ほど出てくるね
カストリ雑誌なんかもかなりあけすけなものも載ってるな

275 :無名草子さん:2022/09/24(土) 06:59:02.31 .net
稲垣足穂はないけど、
「一千一秒物語」の序文(佐藤春夫)は校正待ちになってるよ。

276 :無名草子さん:2022/09/24(土) 16:33:34.90 .net
底本に明らかなへんな誤字みつけると、ママ注記にするか、訂正の上「底本では」注記にするかで悩む。

277 :無名草子さん:2022/09/24(土) 16:45:59.22 .net
>>276
>青空文庫での入力校正作業は、原稿の誤りをただす「校閲」でも、最善と思われる本文を編集する「校訂」でもありません。
>つい底本の全文を初出や親本と突き合わせてみたくなる気持ちも、テキストに対する積極的な愛情のひとつではあります。
>とはいえ作業の上では、別底本が参照できて客観的に訂正可能なもののみを誤植注記し、辞書や用例等に鑑みて疑わしいと思われるだけのときは、ママ注記にとどめてください。

青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

278 :無名草子さん:2022/09/24(土) 16:54:36.28 .net
ありがとう。
FAQ、耕作員になったときに目を通したはずだが、
実際の作業をいくつも経験してから改めて読むと、深いな。

279 :無名草子さん:2022/09/24(土) 17:38:38.00 .net

皆協力する姿勢に感動した
俺もそのうち工作員になりたい
しかし工作員ってイメージ悪いなw

280 :無名草子さん:2022/09/24(土) 19:56:56.65 .net
「耕作員」もあるよ

281 :無名草子さん:2022/09/24(土) 22:21:44.03 .net
佐藤春夫と幸田露伴ってどっちが日中の古典に造詣が深かったのですか?

282 :無名草子さん:2022/09/25(日) 22:44:51.33 .net
も~山本周五郎ばっかりじゃん!!!
山本周五郎死ね!!!!

283 :無名草子さん:2022/09/25(日) 23:42:00.71 .net
お前が死んだことにして工作員に生まれ変わるんやで

284 :無名草子さん:2022/09/25(日) 23:52:49.33 .net
>>267
一応買いなおした証明どうぞ
一番気に入ってる方だけ買ったけど
今は3部作というくくりになってるらしくて他も気になってきあ
https://i.imgur.com/9meVydG.jpg

285 :無名草子さん:2022/09/25(日) 23:59:07.48 .net
>>284
すまんちゃ
はりなおし
https://i.imgur.com/93G5f49.jpg
久々に文庫本読んでるけれどスマホの画面になれてると文字が小さいしページ中央辺りが読みづらくて辛い
昔はこんなのを朝から晩まで熱中して読んでたんだな

286 :無名草子さん:2022/09/26(月) 00:01:34.25 .net
今のうちに予言しておくと’22/08月-’22/09月の月間アクセス増率分析では知里幸恵が躍進。
「100分de名著」で「アイヌ神謡集」が取り上げられた効果が見られるでしょう。

287 :無名草子さん:[ここ壊れてます] .net
>>282 もう死んでるww

288 :無名草子さん:2022/09/26(月) 02:23:35.52 .net
山本周五郎は2度死ぬ!

289 :無名草子さん:2022/09/26(月) 03:45:42.05 .net
工作員に転生させられた。が、そこは青空文庫のない異世界だった。続く...

290 :無名草子さん:2022/09/26(月) 04:50:57.83 .net
青空文庫好きの下剋上!

291 :無名草子さん:2022/09/26(月) 12:48:07.89 .net
>>290
それストーリーが全く予想できません

292 :無名草子さん:2022/09/26(月) 13:09:17.44 .net
工作員に転生って背乗りとかの話じゃないのか
いや青空文庫で入力校正作業するのに戸籍の偽造をする必要は当然ないけど……

293 :無名草子さん:2022/09/26(月) 19:07:47.87 .net
私は青空文庫の工作員。
北の黒電話のお陰で嫌な印象が付いたけれど言葉だけれどパンチドランカーの私にはとても誇らしい名称です。
パンチドランカーというのはボクシングじゃなくて保護期間が切れた小説を入力公開する人の二つ名です。
なんせ青空文庫の8割は私が入力したんだから。
私は地震で倒れてきた書棚の下敷きとなり呆気なく異世界転生。
転生先はとても貧しい家族の末娘。
私の異世界青空文庫ビブリアファンタジーの始まりだ。

こんな感じ?

294 :無名草子さん:2022/09/26(月) 19:13:20.35 .net
↑「著作権存続中」で登録申請してください

295 :無名草子さん:2022/09/26(月) 19:18:08.64 .net
>>294
いやいやまってよ
異世界だと日本の著作権関係ないから
あとビブリアファンタジーってのが何なのか分からん
ビブリアってなに?

296 :無名草子さん:[ここ壊れてます] .net
ギリシャ語で本(複数形)、ラテン語で聖書

『ビブリア古書堂の事件手帖』を御存知でない?

297 :無名草子さん:[ここ壊れてます] .net
>>281
どういう指標で優劣つけるの?

298 :無名草子さん:[ここ壊れてます] .net
>>296
ありゃーした
タイトルだけは知ってる
そうかスコップとシャベルみたいなもんか

299 :無名草子さん:2022/09/27(火) 05:38:39.48 .net
高見順は最近解禁だからあんまり作品数ない感じ?
なんか過小評価されてねえかい。左翼転向組だからかな
あと武田麟太郎は戦前めちゃくちゃ人気だったし46年没だからどんどん追加して

300 :無名草子さん:2022/09/27(火) 06:36:47.17 .net
没後50年なら椎名麟三とか来年来たはずなのにな
TTPだかTPPだかPPTだか知らんが死ね!

301 :無名草子さん:2022/09/27(火) 08:02:30.02 .net
>>299
校正待ちが待ってるよ

302 :無名草子さん:2022/09/27(火) 18:42:59.10 .net
> TTP
知らん
> TPP
ターボパスカル
> PPT
パワーポイント

303 :無名草子さん:2022/09/27(火) 20:13:36.92 .net
TPP11よりも日欧EPAの方が……

304 :無名草子さん:2022/09/29(木) 16:07:46.82 .net
>>268
四畳半襖の下張り

305 :無名草子さん:2022/09/29(木) 23:33:50.88 .net
「某のアレを入力したいけどこの御時世だと顰蹙を買いそう……」と思ってしまう

306 :無名草子さん:2022/09/30(金) 12:38:01.00 .net
著作権切れてるか切れてないか以外の基準なんて設けるだけ無駄
公開も作業もされてないから入力する、校正待ちだから校正する

もちろん全部やるのは不可能なので底本が入手出来るかどうかとか分量とか好みとか作者との縁(同じ出身地とか)による取捨選別はあるけどね

307 :2022年10月公開予定作品一覧:2022/09/30(金) 18:10:12.09 .net
2022-10-01 山本 周五郎『入婿十万両』
2022-10-02 佐藤 春夫『二つの愛国型』
2022-10-03 山本 周五郎『暗がりの乙松』
2022-10-04 ホワイト フレッド・M『ドレントン・デン特派員の冒険 04 第四回 灰』
2022-10-05 山本 周五郎『正体』
2022-10-06 坂口 安吾『「大国主命」』
2022-10-07 作者不詳『現代語訳 平家物語 10 第十巻』
2022-10-08 山本 鼎『「槐多の歌へる」序』※命日、作品初公開
2022-10-09 山本 周五郎『蛮人』
2022-10-10 中谷 宇吉郎『無知』
2022-10-11 岡本 一平『怪物取組画譜 出羽ヶ嶽その日その日』※命日
2022-10-11 片山 敏彦『暗い時間に』※命日
2022-10-12 浅沼 稲次郎『休養を取る日を』※命日
2022-10-13 山本 周五郎『松風の門』
2022-10-14 正岡 子規『牡丹句録 子規病中記』※誕生日
2022-10-15 岡本 綺堂『河鹿』※誕生日(旧暦)
2022-10-15 木下 杢太郎『伊豆伊東』※命日
2022-10-16 山本 周五郎『嫁取り二代記』

308 :2022年10月公開予定作品一覧:2022/09/30(金) 18:10:45.15 .net
2022-10-17 柳田 国男『産婆を意味する方言』
2022-10-18 尾崎 士郎『風蕭々』
2022-10-19 山本 周五郎『あすなろう』
2022-10-20 九条 武子『六甲山上の夏』※誕生日、初公開
2022-10-20 坂口 安吾『私の探偵小説』※誕生日
2022-10-21 江戸川 乱歩『暗黒星』※誕生日
2022-10-21 尾崎 士郎『早稲田大学』※早稲田大学創立記念日
2022-10-22 坂口 安吾『神童でなかったラムボオの詩 中原中也訳『学校時代の詩』に就て』※中原中也命日
2022-10-23 山本 周五郎『榎物語』
2022-10-24 中谷 宇吉郎『紙の行方』
2022-10-25 原 杞憂『追悼記』
2022-10-25 原 民喜『追悼記』
2022-10-26 山本 周五郎『改訂御定法』
2022-10-27 尾崎 士郎『叛骨・中野正剛 ――主観的な覚え書き』※中野正剛命日
2022-10-27 木下 夕爾『夜学生』※誕生日
2022-10-28 正宗 白鳥『ペンクラブと芸術院』※命日
2022-10-29 山本 周五郎『源蔵ヶ原』
2022-10-30 永井 荷風『心づくし』
2022-10-31 ポリドリ ジョン・ウィリアム『吸血鬼』

309 :無名草子さん:2022/09/30(金) 18:53:13.37 .net
>>305
某のアレってどれだろう

310 :無名草子さん:2022/09/30(金) 19:18:36.07 .net
単純に時代錯誤な作品というだけならいくらでもあるだろうけど
「この御時世」がもっと狭い期間を指すなら山口二矢の供述調書あたりかな

311 :無名草子さん:2022/09/30(金) 19:27:58.38 .net
来月の公開作品に浅沼稲次郎いるじゃん

312 :無名草子さん:2022/09/30(金) 20:45:59.62 .net
ハロウィンに「吸血鬼」公開はなるほどと思った

313 :無名草子さん:2022/09/30(金) 21:02:23.10 .net
>>312
どの吸血鬼なんだろう

314 :無名草子さん:2022/09/30(金) 21:09:39.24 .net
>>313
「どの」も何もジョン・ポリドリの『吸血鬼』って複数あるの?

吸血鬼 (ポリドリ) - Wikipedia
https://ja.wikipedia.org/wiki/%E5%90%B8%E8%A1%80%E9%AC%BC_(%E3%83%9D%E3%83%AA%E3%83%89%E3%83%AA)

315 :無名草子さん:2022/09/30(金) 21:22:55.99 .net
>>314
いあ、タイトルだけだからドレかわからなかったのよ
んで見てきた
ぱっと見て失業中に見えた
目薬刺してくる
https://www.aozora.gr.jp/index_pages/person2039.html

316 :無名草子さん:2022/09/30(金) 21:29:22.49 .net
ちょっと上にめっちゃ大ヒントあるやん……

と思ったが最近来た人なら1ヶ月分の公開予定作品の一覧が前月末に定期保守代わりとして書き込まれるのは知らないか

317 :無名草子さん:2022/09/30(金) 22:56:36.90 .net
入力申請しようかどうか迷ってると他の人に入力はおろか校正まで済まされて公開まで話が進んでしまう(※もちろん良いことではある)
その一方で同じ程度の知名度があるはずの作品を入力したらしたで何故か校正待ちの状態が長く続いてしまう

なんでだろ~なんでだろ~

318 :無名草子さん:2022/09/30(金) 23:49:20.04 .net
>>316
別だけど長文は自動的にあぼーんしてるので最初から見てない俺がいる
青空文庫スレは落ち着いてるのですが
他のスレが危なくてこういう設定入ってるやつもいると頭の片隅にでも入れておいてもらえると嬉しいです

319 :無名草子さん:2022/09/30(金) 23:57:45.75 .net
既に組んだことのある人がいたら
その人の癖や作業の信頼度が分かっているから
自然とそういう相手(の入力テキスト)を選んでしまうということはあるんだろうか

「この方とこの方のペア、よく見かける気がする」というのがある

だとすれば、作品そのものや申請タイミングなどの要素よりも、
属人的要素によりそのマーフィーの法則的なのが発動している可能性あり

320 :無名草子さん:2022/09/30(金) 23:59:49.63 .net
>>318
それはあくまでもあなたの嗜好から来る選択(都合)であって
合理的とはいえない

皆に配慮を求めることではない

321 :無名草子さん:2022/10/01(土) 00:06:07.98 .net
むしろ意図的に見てない書き込みがあるなら話の流れがありそうな時くらい確認しそうだが

322 :無名草子さん:2022/10/01(土) 00:16:59.70 .net
>>319
大前提としてアクティブユーザーが少ないから常連で組んでる印象が強くなるのでは?

文アル文スト経由で工作員になった人達は特定の作家の作業で固まってるかもしれないけど

323 :無名草子さん:2022/10/01(土) 00:27:23.66 .net
>>320
他人に配慮しろなんて一切書かれてないので過剰反応するな
落ち着け
自分自身が馬鹿だというレスはいくらでもしてよいが
他人へのヘイトレスは控えようぜ

324 :無名草子さん:2022/10/01(土) 00:36:30.59 .net
他人をヘイトはしていないし
そんな言葉を使ってはいないから
あなたこそ落ち着いて読んでくれ

なにかを頭の片隅に置いてほしいということは
それを踏まえて考えてくれということ

それを配慮を求めると言わなかったらなんだと言うのかなあ


「こういう環境で見ている人は、気づけないこともある」
という事実だけが提示されてれば、そういうこともあるのかーと思うだけだったが

それを身体的理由でもないのに
自分の勝手で見ないようにしているものを
頭の隅に置いてくれと言われても、
それはいかがなものですか?
と感じたにすぎない

325 :無名草子さん:2022/10/01(土) 00:43:25.27 .net
触れたらダメっぽい

326 :無名草子さん:2022/10/01(土) 00:56:07.42 .net
>>322
文アル文ストから耕作員ってコース、あるんだ?

文アル文ストから文豪本人に興味を持つまではありかもなと思ってたが
実際問題、世界観はまるで別物だし
そこまでのめり込めないかと思ってた

327 :無名草子さん:2022/10/01(土) 01:46:17.95 .net
文ストは知らないけど文アルから工作員は結構いると思う、というか、以前はもっといた
何人か要領のいい人がいて、いろんな作家の入力校正をやっていたから
少し前までは今よりも誕生日とか命日の公開が充実していた気がする
最近は動きがないみたいだけど……

328 :無名草子さん:2022/10/01(土) 02:04:23.82 .net
自分は入力も校正もやる方だけど、自分の入力作品を校正してくれた人の入力作品を
お返しの気持ちで校正することは確かにある(※お互い面識はない)
ただし手を出すのは興味のある作家・作品だけですね
知らない作家の校正はミスしそうで、ハードルが高く感じる

329 :無名草子さん:2022/10/01(土) 02:13:49.94 .net
>>326
文ストか文アルかは知らんが佐藤春夫あたりはその辺のファンが布教活動の一環で作業してるのが如実に現れてると思う

330 :無名草子さん:2022/10/01(土) 02:20:46.79 .net
むしろ少なくとも第一印象では著者にも内容にも興味ないくらいの方が「いつもの感じだろうと何となく読んでしまう」ということが起こらないので間違いを見つけやすい気がする

331 :無名草子さん:2022/10/01(土) 11:30:08.04 .net
文スト文アル関係者で一番貢献してたのは、花袋の校正を黙々と片づけてくれてた人たちだと思う
(本人に直接確認したわけではないから関係者というのは推測だけど)
春夫は……まあ声が大きい工作員がいるな、とは思う……

332 :無名草子さん:2022/10/01(土) 11:37:43.75 .net
知らない作家の入力校正をすると、たとえば「一見して誤記っぽいけどその作家ではよく見られる表現」みたいなものに
気づかず誤記注記とかママ注記とかをつけてしまって、後の作業をする人に迷惑をかけたりするから
まあ作家の知識はあるに越したことはない

333 :無名草子さん:2022/10/01(土) 13:07:14.34 .net
>>331
花袋、そうなんだ

自分はキャラ設定画くらいしか知らんのだけど
ほかの文豪の格好よさに比べて
蒲団キャラはあんまりにもあんまりじゃないかwwと思っていたので
何か安心したw

334 :無名草子さん:2022/10/01(土) 13:09:17.90 .net
ワイの入力してるマイナー作家もイケメン擬人化しないかな

335 :無名草子さん:2022/10/01(土) 13:12:48.18 .net
何きっかけだろうと何年かかろうと
最後までやりきれるならどんな人でも嬉しい

336 :無名草子さん:2022/10/01(土) 18:59:48.11 .net
10月も隙あらば山周なんだな・・・
中宇が減ったな

337 :無名草子さん:2022/10/01(土) 19:23:22.56 .net
隙を見せてるのは山本周五郎作品の作業してる方じゃなくて他の作家の作品の作業をしてない方

338 :無名草子さん:2022/10/01(土) 19:27:27.26 .net
著作権切れしていて作業未定の作者名と作品名一覧とかあるのだろうか
参加出来るようなの有ればと思うんだが

339 :無名草子さん:2022/10/01(土) 19:32:02.80 .net
>>338
作者の一覧はあるけど(青空文庫のトップページから見られたはず)
さすがに作品名はないから各自お調べヨロってところじゃないかな?

340 :無名草子さん:2022/10/01(土) 19:41:20.55 .net
アクティブ耕作員さんはそんなに少ないのだろうか?

yozoraで見られる作業状況(最近4週間の動き)を見るとたしかに
耕作員名が限られた常連だけにしか見えないけれど、

入力テキストや校正テキストが点検済みや校了になる時の日付が
点検チームに送ったメールの日付になることをあわせて考えると、
点検済みや校了に進んでも「最近の動き」に載らないものの方がたぶん多い思うんだ

常連さんのは品質が安定していて点検も早くすむだろうから、「最近の動き」に載りやすいというか

341 :無名草子さん:2022/10/01(土) 19:46:54.64 .net
>>338
青空文庫の「登録全作家インデックス」なら「公開中:0、作業中:0」が載ってる
具体的な作品一覧はない(Wikipediaやコトバンクを調べたら載ってるかも)
https://www.aozora.gr.jp/index_pages/index_all.html

校正だけでいいなら「青空文庫校正待ち作品検索」がある
ここのURLは何が引っかかってるか分からないけど何故か書き込めない

「死せる作家の会」は没年別に作家の生没年と一部の作品名が載ってるが青空文庫との直接的なリンクはしてない
ちなみに2004年で更新が止まってる
http://www.jca.apc.org/~earthian/aozora/dead.html

あとWikipediaには没年カテゴリがあるので1967年以前の没年カテゴリをちまちま調べたら良い作家に巡り会えるかもしれない
例:Category:1967年没
https://ja.wikipedia.org/wiki/Category:1967%E5%B9%B4%E6%B2%A1

342 :無名草子さん:2022/10/01(土) 20:03:21.88 .net
今月の公開作品でいえば
山本周五郎は10作品公開に3人が関わってる
(※1つは法人名義なので複数人いるかもしれないが)
尾崎士郎は4作品公開に5人が関わってる
坂口安吾は3作品公開に4人が関わってる

入力者と校正者さえ見つかればいくらでも作品が公開されるというだけのこと

343 :無名草子さん:2022/10/01(土) 21:21:35.01 .net
>点検済みや校了に進んでも「最近の動き」に載らないものの方がたぶん多い

受け取り報告メール、どれくらい来なかったら問い合わせする?
それとも問い合わせはいっさいしない?
点検が忙しいのだろうことは想像に難くないし、催促するつもりもまったくない
けれど、ファイルが届いてないのでは(または見逃されてしまったのでは)と心配になること、ない?

344 :無名草子さん:2022/10/01(土) 21:58:06.42 .net
>>343
>受付の確認やファイルの点検について

>入力ファイル受領時、校正ファイル送付時の「点検作業」は、少数の点検チーム(ボランティア)によって担われています。
>作業待ちのタスクが重なっている場合、返信や送付・確認にしばらく時間がかかることがあります。こちらも気長にお待ちください。

作業着手連絡システム
https://reception.aozora.gr.jp/


俺も8月末に入力ファイルをいくつか送って1ヶ月くらい待ってる
Gmailで送ったのもあるから1ヶ月超えると受理されてないかもという心配も出てくるけど
別に校正者確保したわけでもないし残りの作業中作品を送る際にも受領メールが届いてなかったら確認すればいいかなって思ってる

345 :無名草子さん:2022/10/01(土) 22:00:34.70 .net
一ヶ月くらい確認メール遅れるのはざらって大久保さんもツイートしてたな

346 :無名草子さん:2022/10/01(土) 22:02:31.12 .net
最近の動きに載らなくても舞台裏には載るから、それで大体の動き(今は●月提出の辺り処理してくれてるんだなとか)はわかるので、問い合わせたことはないな
半年音沙汰なかったら、次の提出の時にでも軽く訊くかも

347 :無名草子さん:2022/10/01(土) 22:03:56.65 .net
>>339
反応早っ
以降の皆さんも有難う

>>342 さんも
んー作者名分かれば検索に突っ込んで作品名探せばいいしな
ぼちぼち見て行きます

山本周五郎繋がりですが「殺生谷の鬼火」で表示されない文字があるようにみえるのですが
これはandroidビューアー側の問題かな
読書尚友Freeという青空文庫ビューアーだと「……」のような表示になるのです
例えば以下のように「…」で出てきます
怨霊の呻声、鬼火、……立派な道具立てだ、

これはFONT問題とかビューアー側の問題なんだろうか?
分かりづらかったらすまん

348 :無名草子さん:2022/10/01(土) 22:06:27.15 .net
舞台裏なんてあるんだ。知らなかった

349 :無名草子さん:2022/10/01(土) 22:18:07.24 .net
点検グループって何人くらいいるんだろう。入力校正とは違う苦労がかなりあるんだろうな。

350 :無名草子さん:2022/10/01(土) 22:35:05.14 .net
>>347
『殺生谷の鬼火』の話がよく分からん
ブラウザで見てもテキストファイルで見ても三点リーダーだし
「・・・」っぽく見えるか「...」っぽく見えるか、みたいな話?

351 :無名草子さん:2022/10/01(土) 22:48:14.68 .net
>>349
私の知る限りすくなくとも5名はおられる。

352 :無名草子さん:2022/10/01(土) 22:54:02.86 .net
↑何かへんな書き方になってしまった
以前、ここだったかおーぷんだったかで
中の人はふたりくらいしかいないのではないか(二人としかやり取りしたことがない)というレスを見たことがあったから

それよりは多いよ、という意味であって、すくなくとも五人もいるのだから十分だという意味ではないよ

ほんとうはまだほかにもいらっしゃると思うし
こなす作業量と苦労の数々からしたら少数精鋭の極み、とても大変だと思う

353 :無名草子さん:2022/10/01(土) 22:55:33.61 .net
sage忘れた……

354 :無名草子さん:2022/10/01(土) 23:07:06.88 .net
>>350
ありがと
テキストビューアーはうっかり忘れてました
見てきます

355 :無名草子さん:2022/10/01(土) 23:34:49.79 .net
殺生谷の鬼火 山本周五郎
確認しましたが元テキストから三点多用されていたようです
お騒がせしました
https://www.aozora.gr.jp/cards/001869/files/59102_76053.html

356 :無名草子さん:2022/10/02(日) 00:10:53.85 .net
この間の「新文化」の記事には「現在の運営メンバーは6、7人」と記載があります。

357 :無名草子さん:2022/10/02(日) 02:48:04.19 .net
>>356
そういえば>>137で気になってたのに買うのすっかり忘れてたわ
ファミマでプリントしてきた
サンクス

358 :無名草子さん:2022/10/02(日) 14:58:22.70 .net
( ^ω^)あ~お~ぞ~ら う~ん~ ?

359 :無名草子さん:2022/10/02(日) 15:48:21.83 .net
連絡遅いのはしょうがないからどうでもいいけど、連絡来ないと次の入力や校正の申請していいかどうか分からないのよね
連絡来ない状況で新規に申請したところで受付の負担を増やすだけなんだけど

360 :無名草子さん:2022/10/02(日) 16:50:52.86 .net
だいたい青空文庫の話題が出るときって「青空文庫で読めるおすすめ作品!」みたいなのが多いのにここだけは工作員多くてなんか面白い

361 :無名草子さん:2022/10/02(日) 18:33:51.76 .net
ネット掲示板見るかどうかとか抜きに対象者が少なすぎるので、長期間書き込みがなくても落ちないスレくらいしか作業関連の相談や雑談が出来る場所がないんですわ

Twitterとかでもいいんだけど、名前が出た状態で交流しようとすると
「(青空文庫関係かどうかに関わらず)相談に乗ってもらったから、恩返し代わりにこの人の校正やった方がいいかな」
みたいな気遣いも出ちゃって交流が密にならない懸念もある

362 :無名草子さん:2022/10/02(日) 21:20:30.82 .net
>>359
自分はいつも完了前に次の校正申請と底本画像送ってるな
入力は断られたり被ったりしそうもない作品しかやらないから、申請前に着手することもある
作業できる余裕があるときに、待ちの期間をなるべく作りたくないもんで

363 :無名草子さん:2022/10/02(日) 21:51:07.82 .net
>>362
ワイも

作業はじめた後で断られることがあるとしても
ルール違反をしているのは自分だから
自業自得と割り切ってる

ワイも申請するのは(作業人気度的には)マイナー作家だから
実際断られたことはないですが

364 :無名草子さん:2022/10/02(日) 21:53:02.43 .net
>>358


365 :無名草子さん:2022/10/02(日) 22:11:29.07 .net
入力申請が被るのは分からないでもないけど、それと別枠で断られることってあるの?

366 :無名草子さん:2022/10/02(日) 22:21:33.85 .net
>>362,363
ロシアンルーレットしてる様でドキドキしますね

367 :無名草子さん:2022/10/03(月) 05:55:07.11 .net
>>365
とある作家さんの和歌を一首だけ作業しようとした(全集等が刊行されてないマイナーな作家)ら、文化財指定されている短冊の翻刻(豊臣秀吉等)の例外を除き、和歌や俳句の1作品のみでの登録はページ数や作業量の関係上認められない、って感じで断られたことあるよ

368 :無名草子さん:2022/10/03(月) 08:38:45.27 .net
>>367
詩は原則詩集単位で収載という基準の亜種ってところかね

369 :無名草子さん:2022/10/03(月) 14:21:32.01 .net
一々、入力・校正w
そら、時間がかかる。

370 :無名草子さん:2022/10/03(月) 19:56:45.82 .net
>>368
その基準をクリアするために例えば『藤野古白句集』は
一度同人誌として句集を編纂して刊行した後に、その刊行した同人誌を底本として、その同人誌を編纂した編集著作権者が著作権存続作品として青空文庫に収録する
という形を取ってるな

371 :無名草子さん:[ここ壊れてます] .net
>>370
荒業!

372 :無名草子さん:[ここ壊れてます] .net
同人誌を出す難易度が

373 :無名草子さん:2022/10/03(月) 22:48:37.13 .net
ジャンルや利害が合致すれば載せてくれる既存の文藝同人サークルに出会えるかもしれない
やったことないから分からんけど

374 :無名草子さん:2022/10/04(火) 00:20:12.08 .net
どんな程度の同人誌ならOKなんだろうな

底本よりも親本がしっかりしてないとダメそうだが

375 :無名草子さん:2022/10/04(火) 00:21:26.80 .net
親本というか
初出情報がはっきりしているというか

376 :青空文庫アクセスランキング:2022/10/05(水) 22:45:03.13 .net
2022年9月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_09_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_09_txt.html

377 :無名草子さん:2022/10/06(木) 01:08:06.08 .net
めちゃくちゃ変則的な組版を前に途方に暮れたりしたことある?

いままでの公開作品のなかで一番変態な組版の作品ってどれなんだろ

378 :無名草子さん:2022/10/06(木) 09:00:07.60 .net
ホワイトブレッド作品の図版入りの多さは異常
偉い!

379 :無名草子さん:2022/10/06(木) 23:46:49.03 .net
>>286
『アイヌ神謡集』のXHTML版のアクセスランキング見てみたけど

1月 250位 748アクセス
2月 159位 924アクセス
3月 295位 585アクセス
4月 147位 983アクセス
5月 144位 1,075アクセス
6月 175位 948アクセス
7月 227位 869アクセス
8月 236位 767アクセス
9月 66位 2,240アクセス

確かに前月の3倍近いアクセス数だし今年の他の月で一番多い5月と比べてもダブルスコアだな

380 :無名草子さん:2022/10/08(土) 07:59:19.07 .net
【「100分de名著」出演】「ゴールデンカムイ」アイヌ語監修者が教えるアイヌ文学「不朽の名著」その本当の魅力
https://news.yahoo.co.jp/articles/043c3976f03855aa32b0859f4a40f62e8f68483a

9月のNHK・Eテレ『100分de名著』では、4週にわたって、知里幸恵(ちりゆきえ)さんが遺した
『アイヌ神謡集』(岩波文庫)が取り上げられました。解説を担当されている中川裕さん
(千葉大学名誉教授)は、大人気漫画『ゴールデンカムイ』のアイヌ語監修を務め、
好評発売中のヤマケイ文庫『アイヌと神々の物語』『アイヌと神々の謡』(山と溪谷社)の
推薦者でもあります。あらためて、アイヌ文化の魅力と関連書籍の楽しみ方について聞きました。

381 :無名草子さん:2022/10/08(土) 14:44:43.40 .net
アイヌの回全部見たけれどよくわからなかったな
若くして亡くなったアイヌ女性の話が少しとアイヌ神話の解説に終始したよ

382 :無名草子さん:2022/10/08(土) 17:45:59.42 .net
めちゃくちゃ今更ながら曇天文庫が終わってたというかYahooが終わらせていたことを知ってめちゃくちゃ悲しい

383 :無名草子さん:2022/10/09(日) 20:29:06.94 .net
今日偶然知ったけど芥川龍之介の『羅生門』の最後の一文って改稿されてるんだな

『羅生門』の「最後の一文」は一度改稿されていた! 名文が多い小説の“ラスト”を楽しむ方法 | ダ・ヴィンチWeb
https://ddnavi.com/review/585674/

>下人は、既に、雨《あめ》を冐《をか》して、京都の町へ強盗を働きに急いでゐた。
https://www.aozora.gr.jp/cards/000879/card128.html

>下人の行方《ゆくえ》は、誰も知らない。
https://www.aozora.gr.jp/cards/000879/card127.html

384 :無名草子さん:2022/10/09(日) 21:09:15.14 .net
下しか知らんかった

385 :無名草子さん:2022/10/09(日) 22:05:27.05 .net
昔、教科書で習ったのも下だった

386 :aozorablog:2022/10/09(日) 22:15:47.56 .net
青空文庫’22/08月-’22/09月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5096

387 :無名草子さん:2022/10/09(日) 22:20:10.16 .net
>>383
落として読むリストに入れてたけれど知らなかった
ありがとう

388 :無名草子さん:2022/10/09(日) 22:23:39.05 .net
知里幸恵ってアイヌとして生まれて和人の教育を受けて
クリスチャンとして西欧文化にも馴染んで
そうした女性だったからこそ「アイヌ民謡」を
普遍的な文学作品として残せたんじゃないかって思う。

病身で若くして亡くなった薄幸の女性ではあるけど
家族に宛てた手紙とかには茶目っ気たっぷりの
愛らしい姿が見受けられる。

まさかプライベートな日記や手紙が後世
青空文庫で公開されるとは思ってなかったろうけど。

389 :無名草子さん:2022/10/09(日) 22:25:50.32 .net
> まさかプライベートな日記や手紙が後世
> 青空文庫で公開されるとは思ってなかったろうけど。

凡人に生まれてよかったと今心から思ったw

390 :無名草子さん:2022/10/09(日) 22:32:38.67 .net
山周、山周、雨、山周だよ
どうなっとんじゃワレ~

391 :無名草子さん:2022/10/09(日) 22:38:54.94 .net
今月のアクセスランキングテキスト版
1位から14位まで山本周五郎独占かと思いけや
9位に「独居雑感」やるな、永井荷風、山周旋風を阻止するとは

392 :無名草子さん:2022/10/09(日) 22:44:06.06 .net
死んだらそれで終わりだから
後世に残るというのはそれだけで凄い
ただNHKの特集は面白くなかった

393 :無名草子さん:2022/10/09(日) 23:16:26.30 .net
>>389
油断するな「二十歳の原点」の高野悦子だって生前は一大学生だからな
若い時に読んで衝撃を受けて当時書き綴ってた日記のディスクを
フォーマットしたんだけど今になってみれば
一応残しとけば良かったなんて思ってもいる

394 :無名草子さん:2022/10/09(日) 23:42:53.21 .net
芥川龍之介の遺書は「右の条件の実行せられたる後は火中することを忘るべからず。」と書いたのに
内容(本文)はちゃっかり後世に残されてる(青空文庫にも収録)上に更に遺書も普通に残存してる
そりゃ他人からすれば内容も原本も残ってたっていいし死人に口無しだけど本人的にはどうなんだろうな

395 :無名草子さん:2022/10/09(日) 23:49:13.26 .net
死んでも死にきれないw

396 :無名草子さん:2022/10/10(月) 00:10:56.44 .net
死んだら全て終わりだから関係するのは生きている間のみ
あの世あるとかは心のよりどころなだけ
だが弱ってるときは頼りにするし付きあいの潤滑剤にもなるので宗教ってすごいね

397 :無名草子さん:2022/10/10(月) 02:36:15.34 .net
逆に日本画家の奥村土牛の子供が相続税を増やしたくないからとデッサンを焼却処分するなんてエピソードもあるし

398 :無名草子さん:2022/10/10(月) 07:06:28.96 .net
>>394
芥川の場合はそれすらもポーズというか演出で
絶対に後世に残ることを意識して書いてる気がする。
自らの死に対しての演出という点では芥川とか太宰とかは特に
周到に準備していて生き様自体をひとつの作品として
残したかったのではなかろうか。

399 :無名草子さん:2022/10/10(月) 13:20:40.96 .net
日記も人が読むことを前提に書いているものが多いな。
もっとも、元々家の覚というルーツを考えれば、それが本来なのかもしれないが。

400 :無名草子さん:2022/10/10(月) 14:49:14.54 .net
日記を外部に見せる予定のない個人的な備忘録と考えても、本人すら忘れてる時に中身を確認することになるんだから、何も知らない赤の他人でも読めるような書き方になっててもおかしくないわな

401 :無名草子さん:2022/10/10(月) 14:55:50.50 .net
去年田辺聖子の女学生時代の日記が出版されたけど、自分の友人に日記を読ませて感想を聞いたりしてるんだよね
まあ読ませても大丈夫なところだけと書いてるけど
作家を生業にしようというくらいの人って、いつも読者を意識してるんだなと思った
アンネの日記のアンネも後年出版するつもりで書いてた日記があった

402 :無名草子さん:2022/10/10(月) 15:07:31.04 .net
石川啄木は、遊郭等での女遊びの詳細を妻に読まれたくなくてローマ字でこっそり日記に書いてたなぁ
(すさまじい内容だから、青空文庫に入れる猛者は現れるのか……?)

403 :無名草子さん:[ここ壊れてます] .net
ローマ字日記が全集とかに普通の漢字かな混じり文で収録されてて、編集後記とかに「誰々が(または編集部が)日本語表記に改めました」とあったら編集者や翻訳者としての著作権が発生するんだろうか

404 :無名草子さん:[ここ壊れてます] .net
>>403
耕作員のサガで草

405 :403:2022/10/10(月) 16:49:35.59 .net
近所の図書館に確認しに行ったけど『啄木全集 第六巻 日記(二)』(筑摩書房、1967年12月25日初版第1刷)にはローマ字の原文と漢字かな混じり文の両方が載ってた
解題に「本巻の校訂は石川政雄氏と筑摩書房編集部が主としてこれにあたり、……」と書いてあるが誰が漢字かな混じり文を担当したかは分からぬ
まぁ編集部名義だけなら公開後50年で通せたけど大人しくローマ字の原文だけ入力すりゃいい話か

まぁ今入力申請したらここ見てると思われちゃうな

406 :無名草子さん:2022/10/10(月) 18:31:48.23 .net
ここみてると思われても問題なくない?
ここは紳士淑女のスレだし

407 :無名草子さん:2022/10/11(火) 09:59:36.75 .net
左付きルビってXHTML非対応?

408 :無名草子さん:2022/10/11(火) 13:01:22.77 .net
>>407
こんな感じらしい

>[#「開‐柘」の左に「ヒラキ」のルビ]
坂本龍馬 海援隊約規
https://www.aozora.gr.jp/cards/000908/files/51377_39744.html

>[#「天皇」の左に「オホキミ(?)」のルビ]
折口信夫 橘曙覧評伝
https://www.aozora.gr.jp/cards/000933/files/47550_51134.html

409 :無名草子さん:2022/10/11(火) 18:17:25.02 .net
( ・∀・)へぇー

>スメラギ[#「天皇」の左に「オホキミ(?)」のルビ]

こういう注記(ハテナ注記)もはじめて見た。
古い(といっても8年前)テキストファイルのようだから注記も古いのかもしれないが
今だったら「判読不可」になるんじゃないかと思われるが

410 :無名草子さん:[ここ壊れてます] .net
昔のように漢字にカタカナの原型の漢字ルビ付けてるのを青空文庫で見たいな
既にあるなら良いんだけど

411 :無名草子さん:2022/10/11(火) 19:24:32.71 .net
>>409
国立国会図書館デジタルコレクションで公開されてるやつでも「天皇」の右に「スメラギ」、左に「オホキミ(?)」とあるから
引用文が書かれた当時の読み方が正確には分からないから2種類ルビ振りました的な話じゃないかな

橘曙覧評伝 - 国立国会図書館デジタルコレクション
https://dl.ndl.go.jp/info:ndljp/pid/1111722

412 :無名草子さん:2022/10/11(火) 19:56:15.47 .net
なるほど、
元々のルビが「(?)」と表記されてるケースなんだね
そういうのもあるのか

自分だったらどうするだろう、
小心者だからファイル末に「(?)は底本通り」と書いてしまうかもしれん

413 :無名草子さん:2022/10/11(火) 19:56:37.81 .net
>>411
ありがとう

414 :無名草子さん:2022/10/11(火) 20:01:19.21 .net
>>412
そもそも仮に入力者、校正者、点検者が本文内に本文以外の文字を書き込む(打ち込む)なら

[#「○○」はママ]

みたいな注記スタイルになるはずだしな

415 :無名草子さん:2022/10/11(火) 20:46:39.11 .net
>>410
多分だけどFAQの「Q:変体仮名(万葉仮名)が底本で使われていました。どうしたらよいでしょうか?」に引っかかってそのままでは載ってなさそう
青空文庫編 青空文庫FAQ
https://www.aozora.gr.jp/guide/aozora_bunko_faq.html

416 :無名草子さん:2022/10/11(火) 21:07:51.92 .net
>>415
もう一声!
へんたいする以前の漢字に漢字ルビのやつがデジタル画面で綺麗に見たいなという素朴なネタでした

417 :無名草子さん:2022/10/11(火) 21:32:27.95 .net
大正時代に出た『変態性欲』って雑誌が青空文庫入りせんかな

418 :無名草子さん:2022/10/11(火) 21:55:02.98 .net
稲垣足穂ネタ引きずってすまん
文庫本読むの面倒になって楽天koboで500円割引あったのでこっちで買って読んでる
スマホで読みやすい文字サイズで読むのほんま楽

419 :無名草子さん:2022/10/11(火) 22:00:38.75 .net
スレ違い

420 :無名草子さん:2022/10/11(火) 22:21:41.66 .net
ちなみに石川啄木「詩」に載ってる「一年ばかりの間、いや一と月でも」から始まる無題の詩は、『ローマ字日記』の明治42年4月10日の記述が初出らしく、初音ミクの楽曲にもなってるっぽい

421 :無名草子さん:2022/10/12(水) 00:00:28.87 .net
>>417
復刻版を買って入力しよう!!

不二出版 : 変態性慾  〔大正11年~14年〕  全6巻・別冊1 〔復刻版〕
http://www.fujishuppan.co.jp/books/history/%E5%A4%89%E6%85%8B%E6%80%A7%E6%85%BE%E3%80%80%E3%80%80%E5%85%A86%E5%B7%BB%E3%83%BB%E5%88%A5%E5%86%8A1/

422 :無名草子さん:2022/10/12(水) 11:33:29.99 .net
今月の「100分de名著」がちょうど折口信夫だけど
先月の知里幸恵よりちょっとかたい感じがする
アクセス増率的にはどうだろう

423 :無名草子さん:2022/10/14(金) 17:25:03.65 .net
>>431
是非やってくれ

424 :無名草子さん:2022/10/14(金) 18:44:36.63 .net
>>423
入力申請と底本画像送って、メール待ち
校正は8月辺りに全部送ったけど、まだ受け取りのメールが届いてない(いちおう届いてはいて確認中との事)

425 :無名草子さん:2022/10/14(金) 18:56:24.04 .net
俺も送って1ヶ月以上経ってるな
まぁそれでなくても分量がそこそこあるので気長に待ってる

426 :無名草子さん:2022/10/14(金) 19:35:08.51 .net
入力作品だけ送って校正作品は入力のが返事来てからでいいかと思ったけど公開のことも考えたら逆が良かったかな
今追加で送るのは流石に迷惑だろうけど

427 :無名草子さん:2022/10/14(金) 20:17:38.23 .net
お忙しいのね……

428 :無名草子さん:2022/10/16(日) 13:49:04.51 .net
OCR使っても校訂は苦行に近い
まるで写経しているかのようなご利益がありそう

429 :無名草子さん:2022/10/16(日) 18:04:39.51 .net
それゆえに間違い見つけたとき、お宝見つけたような醍醐味を得られるんやで

430 :無名草子さん:2022/10/16(日) 18:08:51.62 .net
最終的には目視が重要とはいえ、OCR校正がより効くのはやはり手入力ファイルなんだろうな。
OCR入力 VS OCR校正だと、校正用比較ファイル作る手間のほうが大きそうに思える。
特に近年のはOCR入力増えてるだろうし。

431 :無名草子さん:2022/10/16(日) 18:37:13.04 .net
元の文章が手入力かOCRかに関わらず簡単な誤字は「校正ツール2.0化ひとりプロジェクト」で解決しそう

432 :無名草子さん:2022/10/17(月) 23:17:47.80 .net
お前ら今日も校正してるか~?

433 :無名草子さん:2022/10/18(火) 01:14:04.83 .net
新着に岡本綺堂が来てる
うれしー

434 :無名草子さん:2022/10/18(火) 07:30:45.92 .net
今日公開の尾崎士郎の小説『風蕭々』、1889(明治22)年10月18日に来島恒喜が当時外務大臣だった大隈重信に爆弾を投げた事件が元ネタなのか
大隈重信は右足を切断することにはなったけど生き残って来島恒喜は殺害に成功したと思って自殺したんだよな

435 :437:2022/10/18(火) 08:04:32.13 .net
校正と校訂を間違えた
青空文庫の工作員に求められるのは校正ですね

【校正】
1. 文字、文章をくらべあわせ、誤りを正すこと。きょうせい。校合(きょうごう)。
2. 印刷物を印刷する前の過程で、校正刷りを原稿に照らし合わせて、誤りを正すこと。また、校正刷り。「校正が出る」

【校訂】
書物の文字、語句などの誤りをなおすこと。特に、古書の本文をいろいろの伝本と比べ合わせて誤りを訂正すること。校。

436 :無名草子さん:2022/10/18(火) 08:17:40.44 .net
その辺は>>277あたりでも話してる

437 :無名草子さん:2022/10/18(火) 18:40:17.05 .net
ネタバレか?

438 :無名草子さん:2022/10/18(火) 18:50:55.50 .net
>>435
とはいってもやはりある程度、「この漢字遣いは今まで見たことないけど、正しいのだろうか?」っていうのは念のため確認しちゃわない?
(これは本来校閲、校訂にあたる作業)

439 :無名草子さん:2022/10/18(火) 18:52:15.99 .net
必要によってはママ注記することになるし

440 :無名草子さん:2022/10/18(火) 19:17:04.51 .net
ここでいう「校訂」って、記念館にあるような直筆原稿と見比べて初出誌以降の刊行物の誤植を指摘したり、品詞分解して文法的な誤りを訂正したりするような研究然とした話であって、
「底本通りだけど青空文庫の作業過程で誤植が発生したと思われるかもしれないから」とママ注記するのは青空文庫の校正作業の延長でしょ

441 :無名草子さん:2022/10/18(火) 19:49:24.30 .net
うん、言わんとすることはわかる

ただ、前に出たコメントの流れで言うと
ママ注記は校正の範囲だけど
底本では○○注記になると校訂校閲に近くなるわけよね

そこの境目の見極めが難しいというか

ウィキソースがやってるようなむやみやたらなママ注記乱発は青空文庫ではやってないし
明らかな誤植を除いて、本当にママ注記の対象とするかっていうのは耕作員の匙加減みたいなところない?

442 :無名草子さん:2022/10/18(火) 19:51:49.67 .net
入力も校正も、自分はわりとその点にに力と時間を割いてる感がある。

443 :無名草子さん:2022/10/18(火) 19:59:15.65 .net
「これは誤字だ!」と思うか「これは誤字か?」と思うか「珍しい表記方使うねぇ」と思うか何も思わないかは各工作員の知識や教養や感受性次第だからなぁ

444 :無名草子さん:2022/10/18(火) 20:10:58.92 .net
ママ注記って点検ではどれくらい修正されるんだろう

445 :無名草子さん:2022/10/18(火) 21:07:31.40 .net
今日公開のやつにママ注記あるかなと思って検索したら

>貴様にはまた[#「また」は底本では「まだ」]別に命を捨てるに適当な時期がある、

>※誤植を疑った箇所を、底本の親本の表記にそって、あらためました。

とだけあった
入力者は底本の親本(旧字旧仮名のもの)も入力しているようだから気付けたのだろう


今月公開の他の作品だと『現代語訳 平家物語』には(どっちも尾崎士郎だな)

>与三左衛門|影康《かげやす》[#「与三左衛門影康」はママ]、

という注記もあった(※ググった限りだと一般的には「与三左衛門景康」か「与三左衛門景安」らしい)

446 :無名草子さん:2022/10/18(火) 21:22:54.16 .net
なにそれかっこいい/////

447 :無名草子さん:2022/10/18(火) 21:57:50.95 .net
僕とフリオと校訂で

448 :449:2022/10/19(水) 00:12:56.40 .net
>>441
確かにそれはそう


レアケースになるけど、例えば>>445の前者みたいに旧字旧仮名の本が新字新仮名で再刊されているような場合については
{新/旧}字{新/旧}仮名の別があれば同じ作品を収録できるというルールを使って、旧字旧仮名と新字新仮名を両方収録して
その中で差異があれば青空文庫内の整合性のために、間違ってそうな方に(これもあやふやだな)「○○は底本では××」注記を入れるということもできなくはないかな
対象となる作品(あるいは作家)は限られるだろうし、それでなくても本文が旧字旧仮名のままで再刊されるという可能性だって十分あるけど

結局は入力者(場合によっては校正者)次第なのかな

449 :449:2022/10/19(水) 00:31:21.41 .net
色々考えたけど色々考えた故に思考が取っ散らかって訳の分からない返事になってしまった気がする
すまぬ

450 :無名草子さん:2022/10/19(水) 06:24:51.03 .net
今日も山周・・・

451 :無名草子さん:2022/10/19(水) 08:58:49.76 .net
死ねよヤマシュウ

452 :無名草子さん:2022/10/19(水) 09:52:30.85 .net
とっくに

453 :無名草子さん:2022/10/19(水) 12:46:57.02 .net
何度も書き込んでるけど普通に入力校正作業した工作員に対する侮辱だよな

454 :無名草子さん:2022/10/19(水) 13:02:41.27 .net
>>453
わかる
字面通りに読めばその通りだ

わかるが、
山周を敬愛していた富田さん、山周、それぞれへの一種の愛着や親しみを込めた、ここならではの山周ジョークとも言える

山周大杉→山周○ね→既に○んでますが
までがセットの

455 :無名草子さん:2022/10/19(水) 13:08:55.88 .net
いわばイジリだな。

いじめじゃないよイジリだよ~が当事者に通用しないのとおなじで
言われて快く思わない耕作員がいるかもしれんのは否定しないよ

456 :無名草子さん:2022/10/19(水) 17:54:36.06 .net
全く面白くない

457 :無名草子さん:2022/10/19(水) 18:10:13.76 .net
へぇ

458 :無名草子さん:2022/10/19(水) 18:25:10.03 .net
山本周五郎が公開されるまでは生きたいと言って闘病生活を送っていた富田氏に絡ませた上で死ねだの死んでるだのと言うのが愛着故の発言とは到底思えない

459 :無名草子さん:2022/10/19(水) 18:33:07.67 .net
おーぷんのほうじゃフリーOCRに旧仮名学習させる話してるぜ

不毛な会話やめて有意義な話しよう

460 :無名草子さん:2022/10/19(水) 18:39:37.13 .net
俺が最近思ってるのは、注記の実例集みたいなのできたらいいなって

もちろん点検グループさんにこれ以上負担はかけたくないから
公式に伺いをたてながら有志を募ったり何らかの形で

FAQや入力校正作業手引きで
「この場合こうする」っていう大まかなことはわかるけど
実際作業してみると、手引きで見たことないケースに遭遇することもある

前例をあたるのを楽にする実例集ね

461 :無名草子さん:2022/10/19(水) 18:45:46.37 .net
人の作業に文句言ってる訳だから感心しないよな
何もせずに文句たれるくらいなら山周ラッシュは俺が終わらせてやるくらいの気概を見せてくれたほうがかっこいい
山周だって公開が続けばいつかは新着がなくなるわけだし、次期山周の座を狙うくらいにがんばってくれ

462 :無名草子さん:2022/10/19(水) 18:46:03.52 .net
もちろん個人が外部サイトでやってもいいのだろうけど

「こういうケースで、こう注記した、こう注記するよう指導もらった」等の情報は個人だけで持っててももったいないな、
共有できたら良いなと思ったんだよね

そういう意味で有志で力と知恵、経験を合わせられればと思ったんだ

463 :無名草子さん:2022/10/19(水) 19:03:05.54 .net
青空文庫入力校正攻略wiki

464 :無名草子さん:2022/10/19(水) 19:20:05.76 .net
>>463
良いね

465 :無名草子さん:2022/10/19(水) 19:48:09.66 .net
wiki記法も覚えなきゃだ

466 :無名草子さん:2022/10/19(水) 20:09:16.65 .net
スレ違いだったらすまないのだが

くの字点と言いながら、横書きのテキストデータでは「く」の字と山が逆向きの/\が使われることにいつも違和感を覚えるんだ

なぜ\/が採用されなかったのかな
(これもこれで見慣れないぶん違和感あるが)

基本的に横書きでは用いられない文字なのだよね
それとも横書きで使われている底本ってあるのだろうか

467 :無名草子さん:2022/10/19(水) 20:34:46.57 .net
文字コードでは、「/」(に似た形状の記号)を「くの字点上」、「\」(に似た形状の記号)を「くの字点下」としているからそれに順番を合わせているんだと思う
Wikipediaの「踊り字」のページ参照

468 :無名草子さん:2022/10/19(水) 21:16:09.86 .net
そうかそういうことなのか

Unicode文字のくの字上と下は見たことあったがセットで並べる固定観念から横組みになるところしか想像してなかった

長いくの字を上下に分けたものを、順番どおり前後(左右?)に並べた結果、山が逆に見えるというわけだね

長いくの字が横になることしか考えてなかった
これからは、/\に対する見方がかわるなあ

どうもありがとう

469 :無名草子さん:2022/10/19(水) 21:17:19.19 .net
横組みというか、横

説明へたでごめんなさい

470 :無名草子さん:2022/10/19(水) 21:19:19.85 .net
表を底本のスキャン画像ですますか、ちゃんとエクセル等で入力し直すか迷う
せっかくだから綺麗にしたいけど、もし画像に力ミスがあったら校正の人の作業が大変になるよな

471 :無名草子さん:2022/10/19(水) 21:27:32.81 .net
両方送ろう(無責任)

それはそれとしてページを跨いでる図表って扱いに困るよね

472 :無名草子さん:2022/10/19(水) 21:30:28.83 .net
むしろ表の作り直しっていうのも有りなんですか。
表つきの作品を作業したことも読んだこともまだないので知りませんでした。
どんなふうか見てみたいです。

473 :無名草子さん:2022/10/19(水) 21:33:54.50 .net
校正待ちの作品が3000件以上あって、古いもので2003年から待ち状態になってるみたいだけど、どういう作品が放置されがちなのかな?
2003年からほったらかしとか少し可哀そうなんだが、同情したらダメな感じ?

474 :無名草子さん:2022/10/19(水) 21:55:14.04 .net
2005年以前から校正待ちの作品一覧

佐藤紅緑『あゝ玉杯に花うけて』…133,444バイト(※旧字旧仮名)
范曄『後漢書 皇后記』…11,782バイト(※なぜか底本情報がない)
范曄『後漢書 光武伝』…60,748バイト(※なぜか底本情報がない)
宮本百合子『書簡・書簡補遺』…350,117バイト
宮本百合子『婦人と文学(初出稿)』…113,002バイト
宮本百合子『湯浅芳子宛書簡』…341,209バイト
森本六爾『日本農耕文化の起原』…117,150バイト(※旧字旧仮名)
山路愛山『勝海舟』…152,519バイト(※唯一の点検済み)
※サイズは、zip圧縮をかけたテキスト版のもので、単位はバイト(byte)です。
 この値を1000で割ると、キロバイト(KB)に換算できます。
 解凍後はおよそ、倍の大きさになります。

みんなで校正待ちを解消しよう!!

475 :無名草子さん:2022/10/19(水) 22:13:33.17 .net
点検前のものは申し込めなくない?
できちゃうの?

476 :無名草子さん:2022/10/19(水) 22:15:00.07 .net
圧縮して半分になってるっぽいけど全角1文字で2バイトになるから書かれてるバイト数≒文字数になるのかな
書誌情報も込みのバイト数だろうけどまぁ誤差だろうし、となると後漢書以外は全部10万字以上の作品になるのか

文庫本は1ページあたり600字だから本文が10万字だとしても文庫本167ページ分くらいか

477 :無名草子さん:2022/10/19(水) 22:16:23.60 .net
山路愛山のは点検済んでることだしずっと気になってた
しかしこれはスキル的にはもちろんボリューム的にも自分にはなかなかにハードルが高いと感じて手が出せないでいる

478 :無名草子さん:2022/10/19(水) 22:19:52.21 .net
それに点検が昔すぎて注記形式とか変わってるはずだから、もしかして再点検されるのかな

479 :無名草子さん:2022/10/19(水) 22:24:04.46 .net
>>475
点検前のものは点検作業が完了してから校正申請を受理する(「校正待ち」から「校正予約」の状態になる)というだけで校正申請が不可というわけではないはず

480 :無名草子さん:2022/10/19(水) 22:25:37.46 .net
「ご注文内容によってお出しする順番が前後する場合がございます。」みたいなものか?

481 :無名草子さん:2022/10/19(水) 22:27:13.69 .net
いつかは誰かが点検しなければならないとはいえ点検さん大変だな

482 :無名草子さん:2022/10/19(水) 22:32:59.21 .net
校正の予約はないけどすぐ点検済みになるのと
校正申請されるまで点検前状態で待機になるのがあんのね。

483 :無名草子さん:2022/10/19(水) 22:35:05.65 .net
>>480
これだね

484 :無名草子さん:2022/10/19(水) 22:46:47.21 .net
インターネッツ時代になってかれこれ20数年余
著者だけではなく工作員が人知れず鬼籍に入っていてもおかしくない年月

485 :無名草子さん:2022/10/19(水) 23:11:50.99 .net
自分はもし死んだときのために
うちの家族にその後の手続きを頼んである

死んだ旨を伝えること
未完成であっても作業ファイルの最新版を青空文庫に送ってもらうこと
どこまで作業したかがわかるメモ(たとえば何回目校正までやった、とか)も作品ごとに書いているのでその内容も伝えること

幸いまだそのときは来てない

486 :無名草子さん:2022/10/19(水) 23:13:17.05 .net
じゃないと、誰かから引き継ぎ交替申請が来るまで
作業中作品が死蔵状態になっちゃうから

487 :無名草子さん:2022/10/19(水) 23:35:26.45 .net
>>482
最近耕作員になっていくつか入力したけど、自分の入力作品は受領メールが来た翌日には校正待ちの点検済み扱いになってるから、恐らくある時期を境に(自分が耕作員を始める前に)原則として入力ファイルを受け取った時点で点検まで終わらせるように方向転換したんだと思う

それで次々に届く新しい入力ファイル(つまり点検前の作品)を点検してて、昔の点検前の作品は校正申請が来るまでは手を着ける余裕がないのかなと思う

488 :496:2022/10/20(木) 00:04:43.29 .net
作業状態を年別で見ると最近の点検前は何人かに絞られてるし、恐らく点検グループのメンバーとかが入力してる作品が中心なんだと思う
他のボランティアを優先しようぜ的な感じで

他の理由があるかもしれないけど

青空文庫の作業状況
https://yozora.main.jp/inp/index.html
※下の方に載ってる

489 :無名草子さん:2022/10/20(木) 10:38:04.27 .net
>>460、471
自分も欲しいし、実例出しに協力したい
前例探すために青空文庫の全文検索をよくやるんだけど
底本がどうなっているかわからないから確信が持てないんだよね

490 :無名草子さん:2022/10/20(木) 22:15:49.81 .net
いまいち使い方知らないから的外れなこと言ってるかもしれないけどGitHubにある青空文庫のデータ一式から注記の箇所だけ抜き取ったりできるんじゃないの?

491 :無名草子さん:2022/10/20(木) 22:52:33.41 .net
500

492 :無名草子さん:2022/10/21(金) 06:40:35.36 .net
問題は、その注記が為されたとき底本がどうなってるかなんだよね。

底本画像の部分切り取り画像とセットになってはじめて役に立つ感じかな。

493 :無名草子さん:2022/10/21(金) 06:41:26.80 .net
>>489
うん、まさにそれ。

494 :無名草子さん:2022/10/21(金) 12:28:51.85 .net
今日公開された作品の注記はこんな感じだな(※別にここでシリーズ化するつもりではない)


江戸川乱歩『暗黒星』

>できなかったが。[#「できなかったが。」はママ]
(句点ではなく読点が正しいのだと思う)


尾崎士郎『早稲田大学』

>高田早苗《たかださなえ》[#ルビの「たかださなえ」はママ]
(正しくは「たかたさなえ」らしい)

>民間に[#「民間に」は底本では「民間の」]
>自刃した[#「自刃した」は底本では「白刃した」]
(底本の親本に合わせたものらしい)

495 :無名草子さん:2022/10/21(金) 12:43:06.67 .net
複製権や編集著作権で概ねカバーできるとはいえ出版物原版権(印刷物のレイアウトなどに関する著作権、いわゆる版面権)って法整備されてないんだよな

496 :無名草子さん:2022/10/21(金) 12:47:54.96 .net
そうなのか
うーん、そうなると攻略wiki立ち上げは、たとえ青空文庫本体とは別運営するとしても難しいかな?

青空文庫のスタンスは、グレーは黒とみなす厳密さだからなぁ

497 :無名草子さん:2022/10/21(金) 15:40:11.38 .net
底本画像そのものじゃなく底本を模して自分で作ったものだったり
NDLにある場合はそのリンクだったりでも駄目かなあ

498 :無名草子さん:2022/10/21(金) 17:23:03.47 .net
国立国会図書館デジタルコレクションに所蔵された作品は青空文庫化の需要はないの?
底本の写真画像だけだと文字列検索できないから少しは需要あると思ったんだけどなあ

499 :無名草子さん:2022/10/21(金) 17:41:51.64 .net
需要があるかは知らないけど、自分はデジコレで読める作品を中心に入力作業してるよ。
デジコレを底本にしてるのは古い本でも校正しやすそうだからだけど

現状デジコレは快適に読書できるUIではなく、
デジコレ本を高精度のocrでテキスト化した次世代デジタルライブラリーも、今のところ全文検索には役立っても読書のためのものではない
デジコレは無料で貴重な本を読めてたいへんありがたいサービスけど、実際あそこで読書するのは厳しい。デジコレでは読まなくても青空文庫化したら読む人はいるだろうね。

気軽に読むには青空文庫のようにもっとテキストを整形しないと難しい。だからどんどんやろう。

500 :507:2022/10/21(金) 19:13:20.56 .net
>>499
情報ありがとう
次世代デジタルライブラリーの存在、知らなかった

501 :無名草子さん:2022/10/21(金) 19:27:21.88 .net
>>497
むしろ底本を模すのが駄目だからこそ著作権者が明確な文章の部分のみを電子テキスト化して公開してるんだが……

(逆に著者の死没も著書の刊行も1967年12月31日以前で著作権保護期間満了のものはうわづら文庫が画像で公開してる)

502 :無名草子さん:2022/10/22(土) 16:02:31.67 .net
むしろデジコレ公開作品のテキスト化(単純なOCR化ではない)こそ積極的にやるべきだよな

503 :無名草子さん:2022/10/22(土) 16:04:54.11 .net
>>502
正確にはテキスト化じゃなくて電子テキスト化だった

504 :無名草子さん:2022/10/22(土) 22:16:57.36 .net
次世代デジタルライブラリーの文字起こしデータ、市販の読取革命よりはOCR精度が高いのかな、とは思うけど、
それでもやはり人間が読むためのデータじゃなくて計算機に検索されることに特化してる感じはする

505 :無名草子さん:2022/10/22(土) 22:24:39.53 .net
Google booksとかも割と滅茶苦茶だからな
そりゃ調べものがあるのに検索しても手掛かりがゼロだった時代よりは十分ありがたいけど参考にしていい水準かというと……

506 :無名草子さん:2022/10/22(土) 22:36:19.22 .net
google booksの本文検索は著作権保護期間内の作品も大量に扱ってるから意図的に文章をバラしてるはず
昨今のAIの進化見てると識字率も組版の再現もいい感じにしてくれる技術がそろそろ出てきていいんじゃないかと思っちゃう
入力校正まで完璧にやってくれる青空文庫ロボ来てくれ

507 :無名草子さん:2022/10/23(日) 08:50:40.81 .net
日本語文献じゃないんだが『元朝秘史』という中世モンゴル語を明代初期の漢字音で転写した歴史書があるんだけど、読取革命にかけたらかなりの精度で文字起こしできていたので驚いたわ
読取革命の開発者がOCRのテスト用データに『元朝秘史』を使ったのではと思えるほどだった

508 :無名草子さん:2022/10/23(日) 08:59:22.87 .net
出版物に牽引が添えられている作品は、積極的に青空文庫化してほしいよ
著作権者らが牽引の需要が高いと考えたからこそ牽引が出版物に含まれているわけで、
電子化されれば牽引を使うよりはるかに楽に検索できるようになるね
昔の人は、パソコンもないのに牽引を自力で作ったのはすごいと思う。ま、そんなこというと活版印刷した職人はもっとすごいけど。

509 :無名草子さん:2022/10/23(日) 17:36:21.99 .net
アプリで読むと便利すぎる。種類もいっぱいあるから自分好みのが見つかるし

510 :無名草子さん:2022/10/23(日) 18:21:26.04 .net
電子テキストの検索の弊害というほどでもないけど、昔の一般的表記と今の一般的表記が違うと検索しても引っ掛かるかどうか分からないという問題があるんだよね

511 :無名草子さん:2022/10/23(日) 18:49:21.24 .net
通読ではなく拾い読みする使い方が多い歴史文書は人名や地名がどこに登場してくるかすぐに検索できるってのがかなり恩恵が大きい

512 :無名草子さん:2022/10/23(日) 18:50:27.26 .net
そこは自分で検索を試行錯誤するしかないね。

513 :無名草子さん:2022/10/23(日) 22:43:36.36 .net
TeX使えるようにならないかなぁ

514 :無名草子さん:2022/10/23(日) 23:33:21.51 .net
>>508
牽引ってなんだろう……ってわからなくったけど
もしかして索引(さくいん)のこと?

515 :517:2022/10/24(月) 07:28:51.45 .net
>>514
素で間違えてたわ、指摘ありがとう
がっつりと索引を牽引と思い込んでたし読みもケンインと思い込んでた

516 :無名草子さん:2022/10/24(月) 07:34:23.45 .net
例えだけど、徳川家康のルビのふり方を徳川と家康でわけると、ブラウザなどで文字列検索した時に徳川家康でヒットしないので困るね
多少ルビの原本再現性が悪くなっても徳川と家康をわけずに徳川家康でルビ振ったほうがよさそう

517 :無名草子さん:2022/10/24(月) 07:58:52.56 .net
>姓と名のルビは「夏目漱石《なつめそうせき》」のように、分割しない。

>名前と肩書、敬称なども、「千田実画伯《せんだみのるがはく》」、「内海紀伊様《うつみきいさま》」のように原則としてまとめる。

入力ファイルを「テキスト版」に仕上げるために
https://www.aozora.gr.jp/KOSAKU/textfile_checklist/index.html

518 :無名草子さん:2022/10/24(月) 12:19:38.29 .net
「徳川《とくがわ》家康」だと「徳川家康」で検索しても引っ掛からないから「徳川家康《とくがわ》」にしようという話では?

519 :無名草子さん:2022/10/24(月) 12:29:40.98 .net
>>518
イエス、イエヤス。
工作員には、検索する人の需要を意識してルビを振るセンスが求められると思ふ

520 :無名草子さん:2022/10/24(月) 12:45:24.84 .net
そもそも青空文庫は著作権の切れた作品を電子書籍として金銭や会員登録などの制約なく自由に読めるようにするのが主目的であって
検索機能を使って過去の言葉の用法の変遷を調べるとか、朗読や漫画などの原作にするとか、作品の舞台となる地域や主役となる人物の宣伝の1つにするとか、読書以外のそれ以外の利用は想定内ではあるけどあくまで副次的なんだよな
副次的な利用のために本来の目的に支障が出たら本末転倒
青空文庫のルビや注記の表記法が視覚障碍者読書支援協会の表記法を踏襲したことも踏まえて考えてみると良い

521 :無名草子さん:2022/10/24(月) 12:59:56.17 .net
古い辞書データ使って形態素解析すると井伊直虎の読みがイイチョクトラになってしまうのよ

522 :無名草子さん:2022/10/24(月) 16:45:00.78 .net
Firefoxはルビを文字列検索できない

523 :無名草子さん:2022/10/24(月) 17:22:19.84 .net
あんこ臭えが来てた

524 :無名草子さん:2022/10/24(月) 23:28:49.77 .net
ブラウザ版って試読版の延長みたいなもんだしルビや注記を無視したデータベースにしたいなら青空文庫のデータを元に自分で作らなきゃ

525 :無名草子さん:2022/10/25(火) 08:17:41.16 .net
堅苦しい挨拶も何なので平易な文にて失礼しますね
青空文庫の発展に尽力されているみなさんお疲れ様です
益々のご活躍を

526 :無名草子さん:2022/10/25(火) 19:59:11.10 .net
ルビ問題なら青空文庫対応のアプリを色々使ってみるのもあり
中には文章から文字を範囲選択してそのまま検索できるものもあったりする

527 :無名草子さん:2022/10/25(火) 20:57:58.82 .net
山本有三(1887-1974)よろしく「近頃私はルビを見ると、黒い虫の行列のやうな気がしてたまりません。」的なノリで
青空文庫のデータからルビや注記を取っ払ったミラー風サイトを作れば良いんじゃなかろうか

528 :無名草子さん:2022/10/25(火) 21:11:17.75 .net
そもそも徳川家康について調べたい人が「徳川家康」のワードだけで調べて見つからないからと諦めるかっていうとそうはならない気がするのよね

「徳川 家康」「徳川」「とくがわ」「とくかは」などなど表記の違いの可能性をあれこれあたるだろう

検索利用を想定して体裁を整えてあげたものを作るまでする必要あるのかなあ?って思った

529 :無名草子さん:2022/10/25(火) 21:12:45.80 .net
スレチだったらごめん。

530 :無名草子さん:2022/10/25(火) 21:58:05.94 .net
1つの単語のルビを集めてデータベースにしてるふりがな文庫みたいに
表記が違うけど同じ固有名詞を指してる単語のデータベースみたいなのは面白そうだな

ただこれはそれなりに知識のある人が全て目を通さないと作れないか……

531 :無名草子さん:2022/10/26(水) 22:15:07.35 .net
これしか知らないから具体名出すけど「Wiki版『早稲田大学百年史』」みたいなのが理想的なのかもな
図表以外が全部テキスト化されており図表も画像で公開されているという青空文庫と同様のテキスト公開に加えて
原本の画像も公開されている(写真は著作権の都合で非公開)

あと上で出ていた要望に答えるという意味で(正直これは青空文庫にはそぐわないかもしれないが)
本文中の大学関係者の名前(本名・筆名不問)が大学の人名データベースとリンクしている機能もある
【参考】
早稲田大学百年史
https://chronicle100.waseda.jp/index.php

532 :無名草子さん:2022/10/26(水) 22:31:16.11 .net
理想的とはどの意味において?

普通のhtmlサイトと何ら変わりないと思うが……
むしろ青空文庫みたいに表示を変えたりできないから読みづらいくらいに感じるのだが

533 :無名草子さん:2022/10/26(水) 22:40:14.32 .net
話の流れとしては、電子テキストと底本画像の両方が公開されてる点と、表記の異なる固有名詞を一元管理してる点じゃない?
ここ最近ずっと読書的な視点の話とデータベース的な視点の話が混同してる気がする

534 :無名草子さん:2022/10/26(水) 22:42:03.78 .net
なるほどその意味か

535 :無名草子さん:2022/10/27(木) 02:31:39.17 .net
いいトコどりは難し
二兎を追う者は一兎をも得ず、とかいうやらん

536 :無名草子さん:2022/10/27(木) 02:39:04.05 .net
まあでもどっちもあれば助かるから両方やればいいんだよほんとは
リソースさえあればね……

537 :無名草子さん:2022/10/27(木) 12:28:50.61 .net
画像データは容量がね……

538 :無名草子さん:2022/10/27(木) 21:51:31.12 .net
いつも気になっているけれど
わざわざ手を取ってまで訊くことでもない気がして訊けないでいるのは点検グループさんたちは底本画像をどう保管してるのだろうかということ

539 :無名草子さん:2022/10/27(木) 21:53:14.23 .net
データベースよりテキストより、サーバのほとんどが画像保存に使われてしまいそうだが
どう捻出してるのかなと

540 :無名草子さん:2022/10/27(木) 22:03:39.37 .net
>>538
手を取るなんて そっそんな恥ずかしい

541 :無名草子さん:2022/10/27(木) 22:30:14.34 .net
画像データのサイズなんて大したことないと思うけど

542 :無名草子さん:2022/10/27(木) 23:06:57.75 .net
Twitterで大長編を共同作業しよう的な動きが出てるな

543 :無名草子さん:2022/10/27(木) 23:39:13.24 .net
テキストデータなら数十キロバイトで済むものでも画像データならPDFにせよPNGにせよ数メガバイト~数十メガバイトになるけど……

最低でもルビの濁点半濁点(つまり「ば」か「ぱ」か)が判別できる程度の解像度でな

544 :無名草子さん:2022/10/28(金) 00:09:58.94 .net
じゃけんみんなはよ校了させましょうね~
校了したら底本画像は削除してるのかな

545 :無名草子さん:2022/10/28(金) 07:53:38.87 .net
>>544
削除してないと思う
誤植指摘の問い合わせに備えて
だから心配なんだよ

546 :無名草子さん:2022/10/28(金) 12:11:37.18 .net
青空文庫FAQの誤植の指摘に関する回答では

>「やはり入力時のミスである」と確認できたものだけを、底本の該当箇所のキャプチャ画像とともにご報告いただけると、助かります。

とあるから公開した後は消してるんじゃないかな

流石に全部をクラウドストレージで残してたら無料分では賄えなさそうだしコストがヤバそう
残してたとしてもデジタルコレクションになくて点検スタッフの家の近くの公立図書館にもない本とかだけじゃないかな

547 :無名草子さん:2022/10/28(金) 13:11:41.61 .net
>>543
一冊につき画像データが50MBあったとして1TBで2万冊
実際には短編も多いから平均は50MBよりはるかに少ないだろうし
その程度ならなんとかなるんじゃね
ローカルで保存して必要な時だけクラウドにあげてもいいだろうし

548 :無名草子さん:2022/10/28(金) 13:15:17.42 .net
>>546
まあそのへんが妥当だと思う
特に初期は入力も校正も紙の本からというケースがほとんどだったんじゃないかな

549 :無名草子さん:2022/10/28(金) 19:35:58.88 .net
誰か訊いてみて……(オドオド

550 :無名草子さん:2022/10/28(金) 20:18:39.87 .net
青空文庫の「最新」の外字フォント一覧を見たいんだけどどうすればいい
txt2xhtml(t2hs.rb)に付属された2012年当時から更新ありそうなもんだけど

551 :無名草子さん:2022/10/28(金) 21:32:11.63 .net
GitHubに全データあるからそこからあれそれして抽出したらできそう(やり方は知らない)
十年くらい前にやってる人がいて記事にしてくれたりもしてたみたいだけど、最近はどうかな
https://github.com/cjkvi/cjkvi-data/blob/master/aozora_gaiji_chuki.txt

https://wakufactory.jp/densho/font/aozora/

552 :無名草子さん:2022/10/29(土) 12:05:29.89 .net
なるほど、試しにやってみたけど、間違ってたらごめん

ttp://pansy.s1010.xrea.com/2022/10/29/%e5%a4%96%e5%ad%97%e9%9b%86%e8%a8%88/

553 :無名草子さん:2022/10/29(土) 17:33:39.66 .net
>>552
さっそくallkanji.txtを拝見させてもらいました。
どうも青空文庫はいまもtxt2xhtmlに付属の外字ファイル群しか使ってないようですね。
唯一見つけたかと思った「鹵,U+9E75,1-83-35,1,1」は外字を使わなくても表示できる文字でした。

554 :無名草子さん:2022/10/29(土) 19:13:02.34 .net
鹵獲の鹵(しお)は普通にJIS2だけど、それとは違う?

>>552
なるほど元がtsvになってるわけか。さらっとRuby書けるの凄いな

555 :無名草子さん:2022/10/30(日) 00:24:26.77 .net
青空文庫見れるAppStoreアプリ10種ほどインストールしてみた
こういうのでパッと気軽に見れたり、連携辞書で熟語を調べられたりするのは隔世の感を感じる
・ソラリ (無料、課金で広告消。有料版も有)
・Yom!青空文庫 (有料プラン月額100円)
・読書尚友 (無料。課金で広告消)
・i読書   (無料。課金で広告消)
・青空本棚1・2 (2は広告枠だけ有)
・neo文庫  (有料。豊平文庫の後継版)
・bReader  (有料)
・名作小説  (無料だが広告有)
・巣ごもり青空文庫 (無料だが広告有)
・巻丸    (無料。基本は小説サイトビューアだが青空文庫対応)
性能に興味があるなら感想レスする

556 :無名草子さん:2022/10/30(日) 00:43:39.88 .net
アプリに関しては、工作員的に関心があるのは「自作のファイルが読めるか否か」ぐらいかな
読めるなら自分の作業で使えるけど、できなかったら用は無い
で、表示できるアプリは基本的に少ない……

557 :無名草子さん:2022/10/30(日) 12:39:34.59 .net
校正の際には読書尚友に読み込ませてるわ
[#縦中横]とか一部の注記が機能してないけどそこまで不便ではない

ちなみに、底本を再現して脱字や衍字を確認するのに、今は表示設定で1行あたりの文字数を調整してるのだけど、
フォントサイズや余白の広さによる間接的な設定じゃなくて、1行の文字数を直接設定できるアプリとかあったりする?

まぁ仮にこの設定機能を実装したアプリがあったとしても、
本によっては句読点や括弧が半角状態だったり、行頭に句読点が来ないように調整されてたりするから、
完璧に再現しようとするならテキストデータを改行して読み込むのが確実にはなるんだけど、流石に二度手間で面倒臭い

558 :無名草子さん:2022/10/30(日) 12:58:27.50 .net
moon+ reader pro だと加工したテキストファイルも読み込めるし
読み上げさせることもできて便利なのでこれを推したい。
OCRソフトで読み込んで漢数字の〇と記号の○とが間違ってる場合でも
読み上げさせるとすぐに気がつけて音読お勧め。

559 :無名草子さん:2022/10/30(日) 13:02:21.32 .net
行文字設定可能なアプリ↓
i読書 14文字〜38文字 (課金でも160円、課金なしでも気になる広告は出ない)
青空本棚2 9文字〜42文字(青空本棚ではなくて2の方です)
ソラリ 8文字〜62文字(ただしフリー版は不定期に動画広告出るので、校正不向きかも)

こんなところ

560 :無名草子さん:2022/10/30(日) 13:20:22.96 .net
>>555
APPだけか
win11ユーザーならPC上でandroid動かせるで

561 :無名草子さん:2022/10/30(日) 13:31:01.71 .net
Android専用も試したいけどWin10ユーザーなんでまだ無理す
青空文庫Ad、青空読書、読書家あたりは興味ある

562 :566:2022/10/30(日) 15:41:37.24 .net
>>559
Android勢だけど「読書尚友があるなら他のもあるのかな~」くらいで聞いたらどれも無かった……
折角教えてくれたのにごめん……

563 :無名草子さん:2022/10/30(日) 17:56:53.11 .net
androidならファイル管理しやすいMHE novel viewerを長年愛用してるけど一般的には読書尚友が使いやすいと思う

564 :無名草子さん:2022/10/30(日) 23:36:54.36 .net
iPhone/iPad限定だけど「縦式」ってエディタアプリが青空文庫形式に対応してて
1行当たりの文字数も指定できるから、校正で使ってる

565 :2022年11月公開予定作品一覧:2022/10/31(月) 13:29:06.02 .net
2022-11-01 萩原 朔太郎『室生犀星君の飛躍』※誕生日
2022-11-01 室生 犀星『純情小曲集 01 珍らしいものをかくしてゐる人への序文』※『純情小曲集』作者(萩原朔太郎)誕生日
2022-11-02 ホワイト フレッド・M『ドレントン・デン特派員の冒険 05 第五回 巨大純白蛾』
2022-11-03 山本 周五郎『霜柱』
2022-11-04 泉 鏡花『三人の盲の話』※誕生日
2022-11-04 大石 誠之助『太平洋食堂』※誕生日(旧暦)、作品初公開
2022-11-04 楠山 正雄『しっぺい太郎』※誕生日
2022-11-05 片山 敏彦『或る時の詩』『泉』※誕生日
2022-11-06 山本 周五郎『饒舌りすぎる』
2022-11-07 作者不詳『現代語訳 平家物語 11 第十一巻』
2022-11-08 山本 周五郎『十八条乙』
2022-11-09 岡本 かの子『食魔に贈る』※登場人物(エドワール・ニニョン)誕生日
2022-11-10 畑中 武夫『太陽を呑む赤い老星の秘密』※命日、作品初公開
2022-11-11 佐佐木 茂索『散歩』※誕生日
2022-11-12 山本 周五郎『醜聞』
2022-11-13 中谷 宇吉郎『日食記』
2022-11-14 山本 周五郎『滝口』
2022-11-15 大下 宇陀児『偽悪病患者』※誕生日
2022-11-15 原 民喜『もぐらとコスモス』※誕生日

566 :2022年11月公開予定作品一覧:2022/10/31(月) 13:29:27.27 .net
2022-11-16 大町 桂月『酒に死せる押川春浪』※押川春浪命日
2022-11-17 中野 鈴子『許南麒の詩のように』※許南麒命日
2022-11-18 徳田 秋声『背負揚』『復讐』※命日(秋声忌)
2022-11-19 吉井 勇『ゴンドラの唄』※命日
2022-11-20 大田 洋子『「屍の街」序』※誕生日、作品初公開
2022-11-21 山本 周五郎『超過勤務』
2022-11-22 ラヴクラフト ハワード・フィリップス『錬金術師』
2022-11-23 菊池 寛『神の如く弱し』※モデル(久米正雄)誕生日
2022-11-23 佐藤 春夫『若き日の久米正雄』※久米正雄誕生日
2022-11-24 山本 周五郎『燕(つばくろ)』
2022-11-25 柳田 国男『私生児を意味する方言』
2022-11-26 楠山 正雄『鉢かつぎ』※命日
2022-11-27 山本 周五郎『ばちあたり』
2022-11-28 寺田 寅彦『猫六題』※誕生日
2022-11-28 中谷 宇吉郎『実験室の思い出』
2022-11-29 大石 誠之助『文明の強売 (断じて不正なり)』※誕生日
2022-11-30 嘉村 礒多『故郷に帰りゆくこころ』※命日

567 :無名草子さん:2022/10/31(月) 14:17:10.35 .net
大下宇陀児とラヴクラフトがあるな
たのしみ
あと朔太郎って言うとおぎやはぎ矢作の子供が一番に浮かぶようになってしまった俺

568 :無名草子さん:2022/10/31(月) 14:43:50.30 .net
ちょうど最近読んだ「名前の話」(萩原朔太郎)からの引用

中には「朔太郎」といふのが本名か雅号かなどと問ふ人もあるが、紛れもなく、親のつけてくれた本名である。僕は十一月一日に生れた。長男で朔日ついたち生れの太郎であるから、簡単に朔太郎と命名されたので、まことに単純明白、二二ヶ四的に合理的で平凡の名前である。

569 :無名草子さん:2022/10/31(月) 23:14:55.45 .net
青空文庫に触れてないしスレ違いな気もするけど面白かった

本を読んだことがない32歳が初めて「走れメロス」を読む日 | オモコロブロス!
https://omocoro.jp/bros/kiji/366606/

図書カード:走れメロス (太宰 治)
https://www.aozora.gr.jp/cards/000035/card1567.html

570 :無名草子さん:2022/11/01(火) 13:34:40.63 .net
>>569
記事内に

>普通に「走れメロス」を読みたい方は、青空文庫で全文読めますので、そちらをどうぞ。

とあるから多分ギリギリセーフ

571 :無名草子さん:2022/11/01(火) 20:30:09.57 .net
>>531
少し前の話を掘り起こして悪いが
渋沢栄一記念財団も「デジタル版『渋沢栄一伝記資料』」で電子テキストと画像の両方を公開してる
もっとも渋沢栄一や他の保護期間満了となった著作権者以外に著作権が及ぶ箇所については一部非公開となっているが……

TOP|デジタル版『渋沢栄一伝記資料』|渋沢栄一|公益財団法人渋沢栄一記念財団
https://eiichi.shibusawa.or.jp/denkishiryo/digital/main/index.php

ついでにいうと国立国会図書館の著作者情報公開調査みたいなこともしてる

著作権者に関する情報を捜しています|デジタル版『渋沢栄一伝記資料』|渋沢栄一|公益財団法人渋沢栄一記念財団
https://eiichi.shibusawa.or.jp/denkishiryo/digital/main/authors_request.html

572 :無名草子さん:2022/11/01(火) 21:00:52.48 .net
渋沢栄一のゲシュタルト崩壊起こした

573 :無名草子さん:2022/11/01(火) 21:22:44.98 .net
渋沢栄一は入力中2、校正中1、公開中0か……

574 :無名草子さん:2022/11/02(水) 20:52:02.12 .net
OCR校正の話は何度も出てるけど
みんなはそれを「校正一回」に数えてる?

(うまく言えないけど)

比較用OCRテキストを作るにももちろん手間と時間がかかるけど
それにしたって目視で全文チェックする校正と比べると
あまりにあっけなくて

入力者のテキストが完璧であればあるほど
OCRを以て一回に数えるのが不安になっちゃうというパラドックスがあるんだ

そんなわけで結局は目視で最低限三回
それに加えてOCR
って感じだ、自分は

575 :無名草子さん:2022/11/02(水) 21:02:31.57 .net
やったことないけどOCR校正って良いの?

576 :無名草子さん:2022/11/02(水) 21:06:40.19 .net
二段組底本の例だと思って読んでくれ

自分の手順だが

見開きスキャン画像に黒い余白がある場合、フリーソフトで一括トリミングして純粋なページ部分だけの画像にする→
自分の使ってるOCRが段組を認識しないので、段ごとの画像にするため、画像を一括で四分割するフリーソフトにかける→
出力連番が望む順番と違うのでこれもフリーソフトで一括リネーム→
OCR→
コピーペーストして一つのテキストに→
比較作業

自分は全てフリーソフトで賄っているのでこんな感じ
段組を認識できるOCRを使えばもっと早いだろうね

二段組見開き18ページ程度の作品で全工程が40分満たないくらいだ
早すぎて不安なんだ

577 :無名草子さん:2022/11/02(水) 21:08:08.20 .net
ちなみに
>>576=>>574です

578 :無名草子さん:2022/11/03(木) 00:20:34.90 .net
>>574,576
ルビはどうしてるの?

579 :無名草子さん:2022/11/03(木) 08:31:41.76 .net
今日も元気だ山周だ

580 :無名草子さん:2022/11/03(木) 11:37:23.36 .net
人の目を通さない作業は事前準備で校正とは見做さないキリッ

581 :無名草子さん:2022/11/03(木) 12:24:24.74 .net
>>578

比較ツールにかけるとき
OCRではつかないルビや注記は
どうしてるの?という話かな?

あくまでも自分の感覚ではだけど、
OCR校正では主に、入力者の変換ミスや助詞や助動詞の間違いを検出するのに秀でてる手法と思う

だからルビ、傍点、入力者注記はやはり底本画像を見て追うことになるね

それでもOCRが生んだテキストをツールに通すと、その追うべき部分がマークアップされて(もしくはマークアップされるはずなのにされなくて)明示的になるので分かりやすい

582 :無名草子さん:2022/11/03(木) 12:27:46.02 .net
>>580
うん、
全く人の目を通さないわけではないのだけど
あくまでも補助的なものと思った方がいいのかなあって気がして
みんなどうしてるか訊いてみた。

583 :無名草子さん:2022/11/03(木) 12:30:00.91 .net
>>581

自己レス

> それでもOCRが生んだテキストをツールに通すと、その追うべき部分がマークアップされて

OCRが生んだテキスト「と入力者テキストと」をツールに通すと



スマヌ

584 :無名草子さん:2022/11/03(木) 16:02:34.70 .net
OCRを比較に使う人よりもOCRを文字起こしの始点として利用する人がむしろ多いんじゃないの?

585 :無名草子さん:2022/11/03(木) 18:15:36.20 .net
いろいろなやり方試してて、もっと効率的な方法ないかなーって質問してるだけじゃないのかな?
俺のやり方はこうだ、お前らのは違うって言いに来たのではないと思うが

586 :583:2022/11/03(木) 18:34:57.15 .net
あー
もしなにか、書き方の感じ悪かったのならごめんね

昔だけど公式ブログ「そらもよう」でも
OCR校正の圧倒的な時間効率の良さについて記事になっていたこともあったから
参考にして校正に取り入れてる人たちいるだろうと思ってたけど
やっぱりOCRといえば入力補助であって、校正での利用はまだまだそうでもないのかな?


>>585
うん、ありがとう、そういう意味です

587 :無名草子さん:2022/11/03(木) 19:25:17.44 .net
OCR校正補助に使ってるけど、マニアックな異体字は拾ってくれない
あと促音を大書きにしているような底本誤植が勝手に小書きに修正されちゃう場合とかもある
(底本の誤植を見落とす可能性がある)
目視が重要であることに変わりはない と思う

588 :無名草子さん:2022/11/03(木) 19:27:55.08 .net
最近30年ほどのワープロソフトで書かれた印刷物ならOCRの信頼性は高いだろうけど、
青空文庫は活版印刷全盛の印刷物が対象だからOCRの信頼性低いので校正に使うという発想は到底出てこないと思うんだが

589 :無名草子さん:2022/11/03(木) 19:31:05.29 .net
新字新仮名に改めて改版されたものが底本のパターンも少なくないけどね

590 :583:2022/11/03(木) 19:34:45.01 .net
>>588
そうでもないよ
これ見てみて

>校正を担う人が少ないために、青空文庫は公開に至れない入力済みファイルをたくさん抱えています。
こうした現状に風穴をあけたいと、点検グループの門田裕志さんは、OCRを校正に利用する実験を重ね、精度の向上と作業時間の短縮を同時に達成できるとの感触をつかまれたと言います。

「校正をやりやすくするために」
https://www.aozora.gr.jp/aozorablog/?p=565

2012年の記事だよ

591 :無名草子さん:2022/11/03(木) 19:45:13.86 .net
>>590
10年前から進捗がないってことは、うまくいかなかったってことだよ
OCRを校正じゃなくて入力原点として使うのが最適解ってこと
何もないところから手入力で文字起こしするんじゃなくて、OCRの出力テキストに手を加えていく方式ね

592 :無名草子さん:2022/11/03(木) 19:48:18.97 .net
OCRで校訂なんて主客顛倒もいいところだよ

593 :無名草子さん:2022/11/03(木) 20:30:08.04 .net
OCRで出した文章と入力ファイルを比較して違いがあったら底本を確認するってこと?

そもそも入力者がOCR使ってたら入力者が一回通った道をまた歩いてるだけでしょ?
自分の使ってるOCRが特別高性能とか入力者が手入力したと分かってる状態じゃなきゃ二度手間過ぎない?

594 :無名草子さん:2022/11/03(木) 20:35:29.57 .net
筆算の結果とエクセル計算の結果を照合します的な二度手間感を楽しみたい人もいるんだと思う
数独みたいな

595 :無名草子さん:2022/11/03(木) 20:39:07.61 .net
ちなみにOCR校正の話が出てたのはおーぷんのほうだ。

596 :無名草子さん:2022/11/03(木) 20:50:13.15 .net
おーぷんの1棚目で出ている。

入力テキストを作るほどのことまではせず
ただOCR通して比較にかけるだけで軽く下チェックができるわけね。

徹底突き合わせの前にひとつでもあらかじめ潰しておくくらいの気楽さでやるぶんにはいいと思う。
入力テキスト作るほどの手間ではないし。

「一回には数えない」ほうがいいね。

597 :無名草子さん:2022/11/03(木) 20:53:39.74 .net
心血を注いでゼロから手入力文字起こししたこと無駄だったと受け入れたくない人にとっては、OCR校訂は意味があると思う
それ以外の人にとってはただの二度手間な宗教儀式

598 :無名草子さん:2022/11/03(木) 20:55:31.19 .net
本人の手入力の正確性、速度もあるだろうね、そこは個人差あるかも

599 :無名草子さん:2022/11/03(木) 21:00:17.83 .net
なんだろう、大根の皮を包丁でむいた後、ピーラーでむいた大根と、皮の厚さを比較する自己満足の世界

600 :無名草子さん:2022/11/03(木) 21:03:24.85 .net
>>599
へんな喩え

601 :無名草子さん:2022/11/03(木) 21:10:21.64 .net
戦いはこれからだ

602 :無名草子さん:2022/11/03(木) 21:29:18.07 .net
>>599
喩えはよくわからないが、つまりやらなくていい自己満足だという意味だよね。

最終的には目視が絶対重要というところさえ揺るがなければ、
やってる人がメリット(誤字脱字検出)を得ている以上、
やらない人が全否定することでもないと思うよ。

みんなでやりやすいように、やろう!

603 :無名草子さん:2022/11/03(木) 21:47:26.84 .net
皮をむいただけでは織田氏の浸みた美味しい大根になる道のりはまだまだ遠い田楽狭間よ

604 :583:2022/11/03(木) 21:52:42.81 .net
さいごに
みなさんどうもご意見ありがとう
いろんな意見聞けて良かった!

だけどもし私の書き込みきっかけで
傷ついたり不愉快になったりした人がいたらごめんなさい

入力も校正もがんばります。

605 :無名草子さん:2022/11/03(木) 21:55:37.73 .net
>>603
織田氏っていうtypoがいかにも工作員ぽくてすき

606 :無名草子さん:2022/11/03(木) 22:02:41.01 .net
今更だけど、上の流れ、
前提の誤解で話が食い違ってるんじゃない?

質問者は「入力者からもらったテキストを校正者として校正する」作業のことを言ってるが

回答者の何人か(?)は
「自分が入力者として入力したテキストを、入力者校正する」作業のことと考えてない?

そう考えると
「心血注いで~」の意味や大根の例えが解る

607 :無名草子さん:2022/11/03(木) 22:08:28.59 .net
質問者などいない説

608 :無名草子さん:2022/11/03(木) 22:39:23.24 .net
第三者から見てると不快に思えるレスする人が何人かいる

609 :無名草子さん:2022/11/03(木) 22:50:13.63 .net
ごめん不快にさせたのなら
>>600は自分
悪気はなかったんだが
そぐわなく感じてぶっきらぼうになってしまった申し訳ない

でも感じた理由が前提の食い違いだと解ったいまは、喩えの意味もわかるが
なんにしてもすまなかった

610 :無名草子さん:2022/11/04(金) 01:06:45.73 .net
手入力したファイルとOCRのファイルなら、手入力したファイルのほうがはるかに信頼できる。
OCRをべた褒めするのは初心者のダニングクルーガー効果だから、適当にからかっとけばいい。

611 :無名草子さん:2022/11/04(金) 03:34:34.57 .net
長編の入力だとocrがあるといざ作業に取り掛かる心理的ハードルが低くなる

612 :無名草子さん:2022/11/04(金) 08:33:01.27 .net
>>611
なんとなくわかる

OCRの出力テキストがお粗末だと、人間さまの出番なので俄然やる気が出る効果があるし、
OCRの出力テキストが立派だと、苦しい作業から解放されてやる気が出る効果がある

613 :無名草子さん:2022/11/04(金) 18:07:55.55 .net
>>612
どっちに転んでもやる気が出てて草

えらい

614 :無名草子さん:2022/11/04(金) 18:49:17.14 .net
OCR出力テキストを起点にすると、クロスワードパズルとか倉庫番とかテトリスやってるようなゲーム感を楽しめるよ

615 :無名草子さん:2022/11/04(金) 19:05:26.69 .net
OCRの吐き出したひどいテキストを綺麗にせずにいられない心理効果があるので、パズル好きとか掃除好きな人はOCRと相性良いと思う

616 :無名草子さん:2022/11/04(金) 19:40:19.10 .net
それはちょっと分かるかも

617 :無名草子さん:2022/11/04(金) 20:16:35.98 .net
ペンシルパズル好き自分、校正好きな理由をここにて知る

618 :無名草子さん:2022/11/05(土) 11:42:59.20 .net
サイゼリヤの間違い探しvs青空文庫の校正作業

619 :青空文庫アクセスランキング:2022/11/05(土) 15:26:07.18 .net
2022年10月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_10_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_10_txt.html

620 :無名草子さん:2022/11/06(日) 00:08:17.88 .net
来月は走れメロスが爆上がりだろうな
>>569のおかげで

621 :無名草子さん:2022/11/06(日) 14:40:27.09 .net
ここ一二週間体調がすぐれなくて
PCの前にあまり座れないでいる

そのために校正が滞ってしまい
なんとかならないのか……
と悩んでる自分にビックリした

本来紙と紙と突き合わせるのが校正の原点なんだから
修正はともかく
チェック作業にはPC要らんやん

スキャン画像を必要に応じて拡大したりしながら作業するのが当然になってて
PCないとできないと思い込んでる自分に草

622 :無名草子さん:2022/11/06(日) 14:41:07.94 .net
思考が機械に依存してそう、自分

623 :無名草子さん:2022/11/06(日) 14:55:36.73 .net
それ以前に思考が活字に依存してるから安心しなよ
手書き文書の崩し文字の読みづらさに耐えて文字起こした先人に感謝しないと

624 :無名草子さん:2022/11/06(日) 15:04:39.23 .net
ほんとだね
先人すごいよ

625 :無名草子さん:2022/11/06(日) 19:43:03.43 .net
とは言っても、当時の手書き文字は当時の人からすれば書き手の癖はあっても概ね第三者も読める程度に一般認知されてた(草書体のように法則に従って崩されてた)文字だったわけで、
さらに和文タイプライターは大正時代からあったと言っても日本語ワープロが普及する昭和50年代までは日常生活では基本的に手書きだっただろうし、
まだ忍耐というレベルの労力が割かれる程に時代の断絶はなかったんじゃないかな

626 :無名草子さん:2022/11/06(日) 20:26:32.11 .net
文豪の手書き生原稿みるとなかなかにエグいもんな

あれを活字に起こしていくのが当たり前のようにできてた先人
俺たちが退化しているのか

627 :無名草子さん:2022/11/06(日) 20:46:31.98 .net
それ以上、原稿の手書きセリフ「ひでえ」を誤読して「ひでぶ」と文字起こしして新ワードが生まれたマンガ『北斗の拳』をディスらないで

628 :無名草子さん:2022/11/06(日) 20:47:24.59 .net
戦前は義務教育だって旧字旧仮名がデフォルトだったしな

629 :無名草子さん:2022/11/06(日) 20:49:52.24 .net
まぁ校訂という作業が存在する程度には手書き文字の読み間違いや書き間違いも存在するけどね

630 :無名草子さん:2022/11/06(日) 21:12:14.72 .net
文豪の手書き原稿とかみてもクセが強くって何書いてか分かんなくって
かつての編集者とか作家を缶詰めにしてとにかく書かせてその後
解読作業してなんとか雑誌掲載に間に合わせてたのかって思うと
ものすごく大変そう
ひと癖ある坂口安吾の担当にされた半藤一利の苦労とか
想像すると忍びない

631 :無名草子さん:2022/11/06(日) 23:35:05.21 .net
遺稿集とかだと稀に直筆原稿の写真が載ってたりするけど7~8割しか読めない
残りの半分は推測の域を出ないもの、もう半分はマジで何か分からないもの

あとお偉いさんに序文を書いてもらって恐らくお偉いさん故にそのまま直筆で載せられてることもあるけど楷書以外は本当に分からん

632 :無名草子さん:2022/11/06(日) 23:38:37.52 .net
スレチだけど江戸時代のテキストを翻刻してるみん翻の人たちのことは同じ電子テキスト化ボランティアとして応援してるな

633 :無名草子さん:2022/11/07(月) 14:48:33.53 .net
ちょっと時間できた
がんばってくる

634 :aozorablog:2022/11/07(月) 21:29:03.62 .net
青空文庫’22/09月-’22/10月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5114

635 :無名草子さん:2022/11/08(火) 21:27:12.89 .net
>>627
くお~!!ぶつかる~!!ここでアクセル全開、インド人を右に!

636 :無名草子さん:2022/11/09(水) 16:38:02.96 .net
>>635
これすこ

637 :無名草子さん:2022/11/09(水) 23:37:05.11 .net
みんな頑張れ

638 :無名草子さん:2022/11/10(木) 12:13:21.65 .net
[第1話]漫古☆知新-バカでもわかる古典文学- - 漫☆画太郎 | 少年ジャンプ+
https://shonenjumpplus.com/episode/316190246946132654

図書カード:蟹工船 (小林 多喜二)
https://www.aozora.gr.jp/cards/000156/card1465.html

639 :無名草子さん:2022/11/10(木) 14:45:11.43 .net
漫☆画太郎に普通を期待したアタシがバカでした

640 :無名草子さん:2022/11/10(木) 20:27:54.48 .net
淡々と書かれてる解説が面白い

641 :無名草子さん:2022/11/11(金) 11:01:12.01 .net
こんな投げ捨て漫画をいつまでもネタにする程度の低さに嘆く

642 :無名草子さん:2022/11/11(金) 12:13:25.74 .net
早押しクイズで「オイジゴ」と読まれたら「蟹工船」と答える

643 :無名草子さん:2022/11/11(金) 19:55:57.12 .net
じゃあ青空文庫冒頭4文字超イントロ
ここならわかる人いそう


「ではみな

石炭をば

ある日の

えたいの

私は、その

吾輩は

隴西の李

「こいさん

644 :無名草子さん:2022/11/11(金) 21:55:43.21 .net
>>643
銀河鉄道の夜

舞姫

蜘蛛の糸

檸檬

人間失格

吾輩は猫である

山月記

細雪

で、あってるかな?
(人間失格と細雪は最初わからなかった)

645 :無名草子さん:2022/11/11(金) 21:56:17.52 .net
割と一言だけでも続きを思い出せるな

646 :無名草子さん:2022/11/11(金) 23:48:50.92 .net
「ある日の」
曲れる者(アーサー・コナン・ドイル)
羅生門(芥川龍之介)
蜘蛛の糸(芥川龍之介)
芸術統制是非(辰野隆)

「私は、その」
人間失格(太宰治)
婦人の過去と将来の予期(小川未明)

647 :無名草子さん:2022/11/12(土) 08:50:21.08 .net
>>644
正解です、やっぱりすごいな。

似た文の指摘もありがとう。そう言えば蜘蛛の糸もある日始まりで結構有名な書き出しですよね。

648 :無名草子さん:2022/11/12(土) 13:55:48.50 .net
クイズネタはクイズスレ立ててやってくれ
こういうのされるの困る

649 :無名草子さん:2022/11/12(土) 15:35:22.53 .net
ごめん、ちょっとした出来心で。
もうやらないよ。

650 :無名草子さん:2022/11/12(土) 16:11:48.05 .net
一回クイズやって答えただけで
別スレたててそこでやれ とは
657こそどこぞいけばいいのでは?

651 :無名草子さん:2022/11/12(土) 16:23:21.52 .net
他の話題と同時進行とかでもないしな

652 :無名草子さん:2022/11/12(土) 18:30:13.26 .net
自治厨どこにでも湧く

653 :無名草子さん:2022/11/13(日) 23:45:57.78 .net
どこぞの音ゲーで夢野久作の『ドグラ・マグラ』をイメージした新曲が公表されたらしくTwitterのトレンドにドグラ・マグラが載ってた

654 :無名草子さん:2022/11/15(火) 19:22:57.78 .net
周りに「中高のときに電子辞書に入ってる青空文庫の本を読んでた」みたいな人が結構いて、やっぱ意義ある取り組みなんだなとしみじみした

655 :無名草子さん:2022/11/15(火) 19:54:51.90 .net
授業中電子辞書でドグラ・マグラ読んで俺カッケーしてたわwダセェ

656 :無名草子さん:2022/11/15(火) 20:00:29.65 .net
「趣味は青空文庫の入力ボランティアです」みたいなこと言うと割と好反応が返ってくる
たまに「卒論書く時に活用しました」みたいなのも文理問わずある

657 :無名草子さん:2022/11/15(火) 20:12:45.15 .net
意義はあるのかもしれないけど、出版社は文庫本で稼ぐ機会を失っている。
古典名著で出版社が稼いだお金が新人を支えるのに役立ってたのかもしれないと思うと、複雑じゃね?

658 :無名草子さん:2022/11/15(火) 20:18:08.62 .net
青空文庫入りするみたいな古典文学って出版社にとってお荷物だったんじゃない?

659 :無名草子さん:2022/11/15(火) 20:30:59.51 .net
青空文庫で無料で読める作品でも有名漫画家が表紙を描いたり文豪なんちゃらとコラボすればコレクターズアイテムとして売れるからね

660 :無名草子さん:2022/11/15(火) 20:44:25.44 .net
むしろ営利企業なんだからこそ現在や将来の作家の育成をメインにしろよと思う
そもそも古典作品の出版だって校訂、現代語訳、解題、編集、翻案(漫画化)、裁定制度の利用とかで青空文庫との差別化は十分可能だからな

661 :無名草子さん:2022/11/15(火) 20:45:47.95 .net
コレクターズアイテムって価値は数百円程度でも所有していることに意味があるからな

662 :無名草子さん:2022/11/15(火) 20:48:39.35 .net
テレビに出て名を馳せた芸能人がYouTuber始めたら「ファンは嬉しいかもしれないけど、テレビ局は彼(女)を番組に出演させて稼ぐ機会を失っている」ってなる?

663 :無名草子さん:2022/11/15(火) 20:53:15.35 .net
小中学生が学校から水洗されて読む古典文学なら収入は手堅いだろう。ポケモンみたいな位置づけ?

664 :無名草子さん:2022/11/15(火) 20:57:29.08 .net
「私たち、日本の漫画を愛しているんです」といいながら著作権者に無断で中国語訳をつけた海賊版をネット公開する中国伝統の焼畑文化と差別化してかないと

665 :無名草子さん:2022/11/15(火) 21:15:30.56 .net
そもそも文庫化や復刊すらされてない作品も沢山あるよね
しばらくして、どっかの文庫から文学アンソロジーが出て読んでみたら、出典に青空文庫と書いてあるという……

666 :無名草子さん:2022/11/15(火) 21:17:14.41 .net
なんにせよ著作権は切れているのだから「出版社が稼ぐはずのお金」というのも変な話
出版社が出すならせっかくなら解説や挿絵で付加価値をつけてほしいよね

667 :無名草子さん:2022/11/15(火) 21:22:56.52 .net
>>666
恩恵を得ていたのは出版社だけじゃないよ、卸売業者や書店もだよ
それを既得権とみなして破壊するか、紙の本の文化として守るかは、個々人の価値観次第

668 :無名草子さん:2022/11/15(火) 21:34:40.12 .net
印刷や輸送や在庫管理や店頭陳列まで視野に入れるなら古典作品の商業流通は現役の文筆家が割を喰うことになるよな

669 :無名草子さん:2022/11/15(火) 21:40:15.47 .net
打倒アンパンマンみたいな?

670 :無名草子さん:2022/11/15(火) 22:15:59.90 .net
>>666
正しくは著作者の収益じゃないかな
出版社は代理販売業だよね
現実は力関係から権力入れ替わってるにせよ

671 :無名草子さん:2022/11/15(火) 22:18:01.79 .net
20年前ライトノベルが1200円!!?
はっゴミのような読み捨て小説で1000円超え!!!?
と驚いてたけど
今は普通の文庫本ですら800円台で更にファッ!!?
となってる
漫画とかも全部凄く値上がりしてるし

きがつきゃう物価全部値上がりで
6畳用エアコンが12万円とか信じられないよ

672 :無名草子さん:2022/11/15(火) 22:31:52.03 .net
定価1円と印字された戦前の本が古本屋で数万円

673 :無名草子さん:2022/11/15(火) 23:42:57.59 .net
紙の本は字が小さくていけねえ
歳は取りたくないのう

674 :無名草子さん:2022/11/16(水) 09:05:57.54 .net
>>666
紙の本の場合著作者に支払われるのは価格の一割に過ぎない
残りの九割は出版社、印刷、製本、運輸、卸、小売などの利益に

675 :無名草子さん:2022/11/16(水) 17:46:54.88 .net
来年1月から電子書籍の国会図書館納本が始まるから、青空文庫で手入力しなくちゃならない本の数は将来的には減りそうだな。まだ電子書籍化してない本も沢山あるけど。

676 :無名草子さん:2022/11/16(水) 17:54:38.22 .net
そうなんだよな。
ほぼ同時に電子書籍になるのがデフォになっていくと
デジタル化という概念自体がこれからは希薄になっていく。

そんな時代の流れの中で青空文庫の将来を思うと少し寂しいときもあるが、
それでも一時代の役割を果たしていることには変わりないと思いたい。

677 :無名草子さん:2022/11/16(水) 18:14:41.54 .net
まあでもこのペースだとあと百年かかっても昭和時代の書籍の青空文庫入り作業も終わらないだろうけどね
ああでもそのうちAIイラストみたいにocrのブレイクスルーが起きて人の手作業なしで組版再現までできるようになるのかな。

678 :無名草子さん:2022/11/16(水) 18:34:17.70 .net
>>676
電子化されてない本はまだまだあるんやで~

679 :無名草子さん:2022/11/16(水) 20:37:48.49 .net
青空文庫は「自由に使えるように一番単純な(互換性の高い)テキストファイル形式で電子化する」という役割もあるのでそこが全部機械任せに出来るかどうかで変わってくる気がするな

半世紀以上先の話だけど国立国会図書館って電子書籍の著作権が切れたらどう公開するんだろうか

680 :無名草子さん:2022/11/16(水) 20:55:25.09 .net
青空文庫読書アプリとFirefox、頼むからルビ検索できるようにしてクレメンス

681 :無名草子さん:2022/11/16(水) 21:00:31.10 .net
>>679
デジコレでネット公開だと思うで

682 :無名草子さん:2022/11/16(水) 21:02:20.96 .net
https://www.ndl.go.jp/jp/event/events/online_20221026.html
電書納本の説明会があったみたい
リフロー版電書よりPDFのほうが収集優先度高めなのは意外だった

683 :無名草子さん:2022/11/16(水) 21:02:30.26 .net
少し脱線してWebブラウザの話するとSafari、Chrome、Edgeはルビ検索できるんだがFirefoxはいまだにルビ検索できない
文学作品などはくせのあるルビがその作品の作風の重要な要素だったりするから
例をあげると「強敵」と書いて「とも」とルビふる『北斗の拳』みたいな高い文学性

684 :無名草子さん:2022/11/16(水) 21:05:21.50 .net
>>681
そりゃそうだろうけどフォーマットはどうなるのかって話

685 :無名草子さん:2022/11/17(木) 00:27:55.19 .net
活字ファンの季節になった
銀杏の落ち葉集めて書棚の落ち葉と交換する時期だわ

686 :無名草子さん:2022/11/18(金) 12:37:04.31 .net
食欲の秋、スポーツの秋、入力の秋、校正の秋

687 :無名草子さん:2022/11/18(金) 18:08:27.14 .net
一年中校正中

688 :無名草子さん:2022/11/20(日) 12:28:23.43 .net
校正ファイルを普段使いとは別のテキストエディタに移し替えて作業したり、違うビューワーで見てみたりすると誤字発見率が上がる気がする

689 :無名草子さん:2022/11/20(日) 13:01:42.84 .net
同じエディタでもフォント変えるだけで変わリそう
○と〇とか紛らわしいけどフォントによっては区別つく

690 :無名草子さん:2022/11/20(日) 13:07:17.24 .net


691 :無名草子さん:2022/11/20(日) 18:08:42.65 .net
googleドライブのOCR
急に使いにくくなったような気がするのだけど
最近アップデートがあったのだろうか

今まではあたりまえに読み取れていた同じ底本がなぜか変なアウトプットに
同じ現象の人いる?

692 :無名草子さん:2022/11/20(日) 23:00:02.75 .net
Twitterで「#青空文庫で一番好きな作品を教えて」というハッシュタグが生まれてる

693 :無名草子さん:2022/11/21(月) 13:33:15.23 .net
一番は難しいな

694 :無名草子さん:2022/11/22(火) 08:34:36.14 .net
かといって10番目に好きな作品と言われるともっと困る
読みたいときにそこにあるってのが青空文庫の良さじゃない?

695 :無名草子さん:2022/11/22(火) 09:04:47.16 .net
選べないよ
優柔不断とかじゃなく

696 :無名草子さん:2022/11/22(火) 14:12:30.17 .net
作家 なら選べるかな?

漱石

697 :無名草子さん:2022/11/24(木) 01:58:23.29 .net
ハッシュタグでないけどTwitter繋がりということで。

Twitterで最近『青空文庫から抜粋するbot』っての見つけてフォローしてるけど、知らない作品を読むきっかけになっていい。

698 :無名草子さん:2022/11/25(金) 02:18:01.66 .net
青空文庫等が詩集を除いて「単行本を一冊」単位ではなく短編なりの「文章を一冊」として収録してるのって単行本の編集著作権に配慮してのことかな

699 :無名草子さん:2022/11/25(金) 04:09:24.08 .net
>>698
単行本の編集著作権と聞いて「ツェッペリン飛行船と黙想」を思い出した
ちなみに「ツェッペリン飛行船と黙想」は著者没後に出た未発表短編集

700 :無名草子さん:2022/11/25(金) 07:50:21.89 .net
>>698
編集著作権については『青空文庫作業マニュアル』の「3.底本を選ぶ 2)出版社の許諾は必要か」で触れてる

青空文庫作業マニュアル【本という財産とどう向き合うか】
https://www.aozora.gr.jp/aozora-manual/

701 :無名草子さん:2022/11/25(金) 09:13:54.00 .net
>>698
分かりやすい記事貼っておく

作者以外に認められる著作権「編集著作権」のこと
https://book.mynavi.jp/wdonline/detail_summary/id=46606

702 :無名草子さん:2022/11/25(金) 20:02:41.26 .net
>>425
これまだ何の返事もないんだけど、やっぱ届いてないのかな?
ちなGmail

703 :無名草子さん:2022/11/25(金) 23:47:35.85 .net
真実は点検さんに聞かないとなんとも
ちなみ私がgmailで7月に送ったある作品は届いていなかったらしく
その後gmailでないアドレスから送り直したよ。
同じく7月にgmailから送った他の作品はちゃんと届いていたんだけど。
gmailの不具合なのか点検作業が大変なのかこちらは判断がつかないから、青空文庫用のやり取りにgmail を使うこと自体をやめたな

704 :無名草子さん:2022/11/26(土) 12:13:09.37 .net
システムから受け取り確認の自動返信をもらえるようになると安心なんだけど

705 :無名草子さん:2022/11/26(土) 15:07:24.68 .net
申請メールが多すぎてスパムに埋もれてしまってるんだろうね、きっと

706 :無名草子さん:2022/11/27(日) 13:24:55.01 .net
スパムに埋もれるとはつまりランチョンミートに埋もれるということか
なかなか羨ましい状況にも思える

707 :無名草子さん:2022/11/27(日) 22:01:52.11 .net
最近校了のペースより作品公開のペースのほうが早そうなんだけど、ストックがゼロになったことって今まであるんかな

708 :無名草子さん:2022/11/27(日) 22:36:45.22 .net
公開ペースを一定にする(毎日なにかしらが公開されるという魅力を持たせる)ためにストックするのは
なにか商業主義的駆け引きを感じて自分としてはあまり好ましく思っていない

そもそも毎日新作?を楽しみにしている層と
そんなこと関係なく必要に応じて検索して青空文庫に公開されてれば嬉しい!という層とでは
後者の方が多いんじゃないかって思うんだよね(個人の感想です)

誕生日や命日まで温存しておかなくたって
完成し次第公開してもらえたほうが
ボランティアも利用者もありがたいと思うのだけどな

709 :無名草子さん:2022/11/27(日) 22:47:44.52 .net
むしろ定期(毎日)更新って公開するための締切を自ら課してるだけじゃないの

パブリックドメインをウェブ上で公開する仕組みも入力や校正のデータも独占・奪取してるわけでもないし
青空文庫での公開の作業を担ってるスタッフだって他の工作員と同様に飽くまでボランティアなんだから
究極的には1年間に1作品以下の頻度の公開でも文句言える立場の人って別に居ないわけで

710 :無名草子さん:2022/11/29(火) 22:23:27.41 .net
公開日を誕生日や命日とかにするのは公平で良いと思う。

711 :無名草子さん:2022/11/30(水) 20:13:07.98 .net
正月公開は何になるのかちょっと楽しみにしてる

712 :2022年12月公開予定作品一覧:2022/11/30(水) 20:28:44.76 .net
2022-12-01 山本 周五郎『だんまり伝九』
2022-12-02 ホワイト フレッド・M『トリガーセンの妻 コーンウォール物語』
2022-12-03 池田 勇人『政府を拘束しない』※誕生日
2022-12-03 佐藤 春夫『「珊瑚集」解説』※「珊瑚集」著者は永井荷風
2022-12-03 永井 荷風『歓楽』※誕生日
2022-12-03 室生 犀星『〈我が愛する詩人の伝記〉(補遺)』※佐藤惣之助誕生日
2022-12-04 山本 周五郎『伝四郎兄妹』
2022-12-05 作者不詳『現代語訳 平家物語 12 第十二巻』
2022-12-06 時枝 誠記『文学教育と言語教育』※誕生日
2022-12-07 坂口 安吾『光を覆うものなし ――競輪不正事件――』※競輪不正事件の不起訴処分決定が報道される
2022-12-08 山本 周五郎『峠の手毬唄』
2022-12-09 夏目 漱石『三四郎』※命日
2022-12-10 大田 洋子『いまだ癒えぬ傷あと ――放射線火傷で右手をうしなつた木挽きの妻と河原にうつ伏せて死んでいた幼女に――』※命日
2022-12-11 山本 周五郎『初午試合討ち』
2022-12-12 中谷 宇吉郎『日本の将来』
2022-12-13 田山 花袋『晩秋の頃』※誕生日(旧暦)
2022-12-14 尾崎 士郎『生きている忠臣蔵 ――忠臣蔵は何故流行するか――』※忠臣蔵の日
2022-12-15 山本 周五郎『春いくたび』

713 :2022年12月公開予定作品一覧:2022/11/30(水) 20:29:06.29 .net
2022-12-16 グリム兄弟『天国へいった仕立屋さん』※ヴィルヘルム・グリム(弟)命日
2022-12-17 山本 周五郎『梟谷物語』
2022-12-18 佐藤 春夫『愉快な教室』
2022-12-19 山本 周五郎『武道宵節句』
2022-12-20 小泉 八雲『お貞のはなし』※翻訳者(田部隆次)命日
2022-12-21 山本 周五郎『蒲生鶴千代』
2022-12-22 柳田 国男『私生児の方言』
2022-12-23 徳田 秋声『青い風』『閾』※誕生日(旧暦)
2022-12-24 ドストエフスキー フィヨードル・ミハイロヴィチ『クリスマスと結婚式 ――無名氏の手記より――』※クリスマスイブ
2022-12-25 矢内原 忠雄『イエス伝 マルコ伝による』※命日
2022-12-26 菊池 寛『たちあな姫』『世に出る前後』※誕生日
2022-12-27 山本 周五郎『半化け又平』
2022-12-28 作者不詳『現代語訳 平家物語 13 灌頂の巻』
2022-12-29 三木 露風『明治詩壇の回顧』※命日
2022-12-30 横光 利一『自慢山ほど』※命日
2022-12-31 寺田 寅彦『宇宙の二大星流』※命日
2022-12-31 中谷 宇吉郎『「寺田寅彦の追想」後書』

714 :無名草子さん:2022/11/30(水) 20:48:32.46 .net
新年の挨拶とかお正月に関するエッセイとかを入力すると1月1日に公開されるかな?

715 :無名草子さん:2022/11/30(水) 22:01:41.61 .net
尾崎士郎訳の平家物語は年内に全編公開か

716 :無名草子さん:2022/12/03(土) 20:06:34.95 .net
山周率9/31

717 :無名草子さん:2022/12/03(土) 21:12:58.55 .net
作家別校了作品の比率から妥当かどうか検討してみてよ

718 :無名草子さん:2022/12/03(土) 22:38:10.19 .net
妥当じゃなかったとして別に問題ない

719 :無名草子さん:2022/12/03(土) 23:30:12.99 .net
作業数多いがゆえに校了して結構経ってるのに公開されてない作品を見るとなんかこの「間」もったいねえなと思うこともあるからガンガン公開して言ってほしい
一時期同じ作家の公開が続いたって無限に作品があるわけじゃないからいずれなくんだしなる

720 :無名草子さん:2022/12/04(日) 03:37:45.27 .net
ガンガン公開しろってガンガン公開準備しろってことになると思うけどそんな厚かましいこと言うほど何か貢献してんの?

721 :無名草子さん:2022/12/04(日) 08:46:28.56 .net
少なくとも毎月毎月「山周ばかり」って文句いうよりはいいと思う

722 :無名草子さん:2022/12/04(日) 11:15:21.78 .net
種類に文句言ってるか量に文句言ってるかという違いだけでどちらも人任せなのは結局同じ
ただし他人により重い負担と労力を課そうとしているのは後者

723 :無名草子さん:2022/12/04(日) 13:07:31.33 .net
>>715
一応14番目の解説もあるけどね

724 :無名草子さん:2022/12/04(日) 13:15:21.77 .net
>>718
割合に応じて案分した結果の数字なのか意図的に配分してるような数字なのか出せって話であって、どっちを選んだら問題あるかないかなんて話はしてないでしょ

725 :無名草子さん:2022/12/04(日) 13:25:29.36 .net
>>719
校了した翌日でも公開は可能な仕組みならともかく校了後ファイルも点検してるって言ってるし、その「間」とやらは作品ごとに差があるとしても公開に必要な期間なのでは?

726 :無名草子さん:2022/12/04(日) 13:40:29.22 .net
いまいち分かってないんですが公開のタイミングって
そもそも誰が決めてるんでしょうか?
校正者の意向なんでしょうか?
誕生日目指して公開できるように頑張るとかの
モチベーションになってるってことであれば意味はあると思うのですが。

727 :無名草子さん:2022/12/04(日) 14:13:43.59 .net
質問させてください
割り注に最大長とかみたいな制約ありますか?

728 :無名草子さん:2022/12/04(日) 14:50:35.94 .net
>>724
いやだから、どっちか数字を出せ!って言われるような潜在的問題はなにもないから、出せって言うなという話でしょ。

729 :無名草子さん:2022/12/04(日) 14:57:55.28 .net
>>727
ここで質問するより点検さんに訊くのが良いと思うよ。
点検さんの手を煩わせるのは申し訳ないと思ってここで訊くのだろうけど、
点検さんとしても訊いてくれたほうが後々の点検が楽になるわけだから、丁寧に質問に答えてくれるよ。

730 :無名草子さん:2022/12/04(日) 15:06:44.26 .net
たしかに電子図書の割注の表示って
結局はユーザの表示する環境次第だから、複数行にわたる長い割注の場合どう表示されるんだろうね

我々の作業ではそこは意識するところではないんだけど

最大長の件、点検さんから答えがあったら、ここで共有してくれると嬉しいが

731 :無名草子さん:2022/12/04(日) 15:13:54.09 .net
>>725
ですね。

公開用XHTMLファイルに変換する作業も人手も必要ですし
出来たXHTMLも公開用サーバに上げるからには表示チェック(校正ほどの厳しい目ではないにしろ通読する)必要もあるんじゃないかと思います。

732 :無名草子さん:2022/12/04(日) 15:32:04.09 .net
あくまで提示されてる情報からの推測だけど、
注記一覧のページを見た限りだと、ルビ、縦中横、行右(左)小書き、上(下)付き小文字、罫囲み、横組み、文字サイズの注記については、
>対象文字が長めの場合や、外字注記が用いられているとき、前方参照型では期待通りに変換されない場合は、始まりと終わりを特定する開始/終了型で、次のように注記してください。
という旨の説明があって、2種類の注記方式を用意してるから、
【[#割り注]○○[#割り注終わり]】だけで【○○[#「○○」は割り注]】みたいな注記を用意していない以上は割り注の注記に文字数の制約はないんじゃないでしょうか

注記一覧 その他 - 青空文庫
https://aozora.gr.jp/annotation/etc.html

733 :736:2022/12/04(日) 15:55:26.44 .net
まだ入力者登録してないので、点検の方に質問するのは後回しにします。

>>732
やはり制限はなさそうですね。
Windows用ビューワーであるPageOneやOyaziViewerでエラー発生するのは確認しているんですが、青空文庫と関係ない話なので厄介そうです

734 :無名草子さん:2022/12/04(日) 22:29:29.61 .net
二段組に対応してるビューワーってあるんだろうか。
大して調べてるわけじゃないけど二段組は再現できない仕様が多いよね

735 :無名草子さん:2022/12/04(日) 23:10:45.47 .net
>>726
作品の公開日については2020年01月01日のそらもようでちょっと触れてる
https://www.aozora.gr.jp/soramoyou/soramoyou2020.html#000512

736 :無名草子さん:2022/12/05(月) 12:45:58.85 .net
>>735
記念日に公開したいって思惑は分かるんですがそれが校正者の意図なのか
公開者の一存なのかが知りたいです

737 :無名草子さん:2022/12/05(月) 16:34:38.57 .net
>>736
校正者の意図か公開者の意図かという話になれば、それは概ね公開者の意図ということになると思う

ほとんどの作業ボランティアは点検グループの大変さや校正テキストファイルを提出してからその先の時間的長さと人的負担を理解していると思うので、いついつ公開してくれという希望は余程のことがなければ出さない(出せない)と思う

738 :無名草子さん:2022/12/05(月) 19:51:55.02 .net
10校正したら1入稿というような何らかの制限つけたほういいと思う
そうしなきゃ自由気楽にきる入力ばかりやってしまう

739 :無名草子さん:2022/12/05(月) 20:01:43.56 .net
発想面白いね

ただそこは作業者次第よ
だって自分は入力よりずっと校正してたいもん、達成感あるしね

だけど校正は点検グループの手を確実に煩わせるから
今は大量申請できないんだ

740 :無名草子さん:2022/12/05(月) 21:38:35.42 .net
校正は自分の作業が確実に近い未来の公開につながるのが魅力よね

741 :青空文庫アクセスランキング:2022/12/05(月) 22:48:09.82 .net
2022年11月

XHTML版
https://www.aozora.gr.jp/access_ranking/2022_11_xhtml.html

テキスト版
https://www.aozora.gr.jp/access_ranking/2022_11_txt.html

742 :無名草子さん:2022/12/06(火) 09:28:56.97 .net
10校正したご褒美に1入力だと今の校正待ちが余ってる状態では成り立つけど最終的に校正待ちファイルが枯渇してさらに入力もできなるなるやで

743 :無名草子さん:2022/12/06(火) 09:51:09.57 .net
だが待ってほしい
入力はOCRの仕事で、校正は人間の仕事になるのではないか

744 :無名草子さん:2022/12/06(火) 11:40:11.36 .net
AI様が次世代デジタルライブラリーのocrと国会図書館デジタルコレクションの底本画像を組み合わせて、片っ端から自動で青空文庫注記をつけてくれた上で青空文庫のデータベース上に勝手に登録してくれて、あとは人が校正するだけになったら相当面白いかも

745 :無名草子さん:2022/12/06(火) 11:56:22.82 .net
>>744
OCRの出力結果が正しいかどうか判断するAIが正しいかどうか判断するAIが正しいかどうか判断する人間のひと手間は避けられない

746 :無名草子さん:2022/12/06(火) 16:30:09.95 .net
>>745
ワロタ

747 :無名草子さん:2022/12/06(火) 18:07:23.19 .net
>>741
まさかの山川方夫短編が上位
おそるべしYouTube

748 :無名草子さん:2022/12/06(火) 18:28:03.19 .net
>>747
YouTubeでなにかあったの?

749 :無名草子さん:2022/12/06(火) 20:01:42.27 .net
>>748
YouTubeで、青空文庫の作品を要約してアニメにして紹介してる方が居て、おそらくその影響で上位になったと思われる
個人的に山川方夫さんは好きな作家だから嬉しい

750 :無名草子さん:2022/12/06(火) 20:34:11.53 .net
なるほど、ありがとう
青空文庫をもとに制作しているYouTubeチャンネルも色々あるけど
それきっかけで青空文庫本家にユーザが来てくれるのは嬉しいね

751 :無名草子さん:2022/12/08(木) 08:25:05.66 .net
[第2話]漫古☆知新-バカでも読める古典文学- - 漫☆画太郎 | 少年ジャンプ+
https://shonenjumpplus.com/episode/316190247017199335

図書カード:にんじん (ルナール ジュール)
https://www.aozora.gr.jp/cards/001156/card50658.html

752 :無名草子さん:2022/12/08(木) 21:12:39.09 .net
また読んでしまった

753 :無名草子さん:2022/12/08(木) 21:40:46.21 .net
文字通りオチが秀逸

754 :無名草子さん:2022/12/08(木) 21:55:53.15 .net
解説の温度差よ

755 :無名草子さん:2022/12/08(木) 23:37:32.37 .net
1話目でいつものパターンそのままでいらんと思ったので
今回はつられないぜ

756 :無名草子さん:2022/12/08(木) 23:52:03.13 .net
教養が無いし翻訳作品はあまり読んでないから普通に知らんかった……

757 :無名草子さん:2022/12/11(日) 11:58:41.29 .net
子どもの頃「少年少女世界の名作文学」で「にんじん」を読んで、これは何を伝えたいんだろうと真剣に悩んだ

758 :無名草子さん:2022/12/12(月) 00:57:59.07 .net
あーおーぞーらーうーんーこー

759 :無名草子さん:2022/12/12(月) 19:50:19.76 .net
みんな、今年の工作員ライフはどうだった?

760 :無名草子さん:2022/12/12(月) 20:09:45.32 .net
青空文庫読者なので工作員の悲喜こもごもを楽しく見させていただいております

761 :無名草子さん:2022/12/12(月) 20:43:12.02 .net
ごめん今週活動してないんだ……

762 :無名草子さん:2022/12/12(月) 21:02:00.00 .net
4~5年放置してるやつをどうにかしないと……

763 :無名草子さん:2022/12/12(月) 22:59:38.94 .net
作業申請するタイミングを逃し続けた

764 :aozorablog:2022/12/12(月) 23:29:35.92 .net
青空文庫’22/10月-’22/11月の月間アクセス増率分析
https://www.aozora.gr.jp/aozorablog/?p=5121

765 :無名草子さん:2022/12/13(火) 06:59:19.63 .net
「JIS X 0213にはないがUnicodeにある漢字」を左ルビに使えるかどうかはビューワーの実装次第?

766 :774:2022/12/13(火) 07:17:10.22 .net
Windows用アプリの左ルビ対応状況を調べてみた
[アプリ名(バージョン)] [JIS X 0213に規定された第3第4水準にある漢字] [JIS X 0213にないがUnicodeにある漢字]

えあ草紙(ver1.3.0) OK OK
PageOne(ver4.00) OK NG
OyaziViewer(ver2.6.5.0) NG NG

767 :774:2022/12/13(火) 11:17:35.42 .net
PageOneはU+1F130からU+1F189までの四角囲みアルファベットを表示できないっぽい

768 :無名草子さん:2022/12/13(火) 15:02:34.25 .net
そらもようにあった25周年記念のイベント?ってまだ期待してでもいいのかな

769 :無名草子さん:2022/12/15(木) 08:55:50.81 .net
UTF-8に移行すれば、難しい字句のWeb検索で青空文庫のhtmlファイルがヒットする確率があがるんだが

770 :無名草子さん:2022/12/15(木) 09:06:48.29 .net
だからずっとutf-8に移行して欲しいってずっと言ってきてる訳ですが
逆にsjisにこだわってる理由があるなら教えて下さい

771 :無名草子さん:2022/12/15(木) 09:18:08.46 .net
中途半端に漢字をJIS X 0213の異体字に置き換える行為って、善意のようにみえて実は作品を蹂躙してるのと同じなんだよなあ
怖いよ、善意の破壊者

772 :無名草子さん:2022/12/15(木) 09:30:25.20 .net
>>771
萩原朔太郎が「ローマ字論者への質疑」で
蝶は「てふ」でなくしてはならないなんていってるけど
現在の日本で蝶と「てふ」として読む日本人が果たして何人いるのか?
言葉は時代とともに移り変わっていくものであり
より良いものが提示されてるのに、検討もされないで思考停止してるのは
残念としか思えない。

773 :無名草子さん:2022/12/15(木) 09:38:55.13 .net
そもそも今のコメントで引っ張ってくる漢字がutf-8の文字なら
そこにひと手間かける意味は何なんでしょうかと小一時間問いただしたい

774 :無名草子さん:2022/12/15(木) 09:39:55.43 .net
>>772
それだと、底本がどんな表現を使っていたかを知りたい、流行の変遷を知りたい、っていう需要に答えられないんだよね
電子化テキストのほうで勝手に情報を捨てたら、復元できないわけで

775 :無名草子さん:2022/12/15(木) 09:41:42.08 .net
「言葉は時代とともに移り変わっていく」のなら、なおのこと勝手にその時代の情報を捨てたらダメでしょ
著作権が切れてるのを良いことに踏みにじりまくってるね
怖いよ、善意の破壊者

776 :無名草子さん:2022/12/15(木) 09:46:22.75 .net
なまじ外字フォントやら注記で置き換えられているのは、がんばれば元のデータを復元できる
問題は、勝手にJIS X 0213に収まる異体字に置き換えてしまうケース
復元できないんだから、文化大革命も同然だよ

777 :無名草子さん:2022/12/15(木) 09:55:29.39 .net
スペインでキリストのフレスコ画をムンクのような絵に変えた事件あったじゃん?もう10年経ってたね


世界中で話題になった「おばあちゃんによる最悪の芸術品修復」から10年、町とおばあちゃんに起こった変化とは? - GIGAZINE
https://gigazine.net/news/20220818-ecce-homo-worst-artistic-restoration/

778 :無名草子さん:2022/12/15(木) 09:59:14.96 .net
さて思考停止しているのはどっちかな

779 :無名草子さん:2022/12/15(木) 10:22:13.21 .net
「諭」(「言+兪」, U+2F9D0)はわりとよく見かけると思うんだが、包摂適用で「諭」にしていいか議論の余地がある。
ちなみにWindows環境だと、Meiryo UIフォントとか使わないと「諭」(「言+兪」, U+2F9D0)は表示できないので不便。

780 :無名草子さん:2022/12/15(木) 10:29:38.40 .net
これと萩原朔太郎の言をを一緒にするのは流石におかしい。
その時代の異字体を大切にしたいなら、その方向での注釈をつけるべきで
utf-8の字体を全面的に拒む理由にはならない。
今後も機会あるごとに青空文庫のユニコード化は訴えっていこうと思います。

781 :無名草子さん:2022/12/15(木) 10:46:40.91 .net
共産主義者が多いのかな、青空文庫の利用者って
賢いフリするのが好きなだけで頭悪そうな感じ

782 :無名草子さん:2022/12/15(木) 10:49:00.00 .net
Google先生に拾ってもらえなくなったらおしまいだよ

783 :無名草子さん:2022/12/15(木) 10:49:52.06 .net
頭悪いは否定しませんが頭悪くっちゃ青空文庫利用しちゃいけないんですか?
というかワッチョイつけて欲しい

784 :無名草子さん:2022/12/15(木) 11:04:49.43 .net
>>769 以降の書き込みは、>>770,772,773,780,783 以外全部同じ人だよ
書いた本人が言うんだから間違いない

外字フォントや注記のままだと、いつまでたってもGoogle先生を始めとするWeb検索エンジンに拾ってもらえない。
Unicode化をぜひやってもらいたい。

785 :無名草子さん:2022/12/15(木) 11:36:23.23 .net
>>770,772,773,780,783 は全部自分なんで、結局二人で言い合ってたわけかorz
この話題は広く議論してもらって、できるならutf-8化の方向で前に進めてもらいたいです。

786 :無名草子さん:2022/12/15(木) 12:02:59.56 .net
突然始まって唐突に終わった気がする
とにかく何が言いたいかというと屁のツッパリはいらんですよ

787 :無名草子さん:2022/12/15(木) 12:30:53.15 .net
普通に名前欄使えばいいのに

788 :796:2022/12/15(木) 12:36:25.66 .net
仮名遣いはともかく、漢字に関しては出版社や印刷所や編集者の都合なり意向なりでいくらでも変わるし変えざるを得ないので異体字の包括表記はそこまで重要ではないと思う
それでもなお必要と思うなら「自分でやれば?」って感じ
自分でサイト作らなくてもWikisourceとかがあるしね

789 :無名草子さん:2022/12/15(木) 12:53:07.17 .net
包摂適用についてはまあその通りで実用に問題ないレベルだと思う
じゃないと今まで放置されてない

790 :無名草子さん:2022/12/15(木) 17:06:07.13 .net
正直自分はUTF-8に対応してくれたほうが嬉しいけど
そもそも現状の青空文庫一強みたいな風潮も変だし、違うアーカイブがもっと増えてもいいんだよねぇ
自分も青空文庫用に作った作品ファイルを自サイトで公開してるけど、その時は極力字を底本通りに直してるわ

791 :無名草子さん:2022/12/15(木) 17:11:03.93 .net
単に電子テキストをアーカイブ化したいって言うなら、青空文庫で入力校正の手続きを踏むより

電子テキストをepub形式にしてKDPやkoboで出版→国会図書館の電子書籍納本、とかのが一人で完結するし手っ取り早いかもしれない

792 :無名草子さん:2022/12/15(木) 17:40:59.57 .net
青空文庫は今のSJIS仕様のままだと、鬼門・地雷原ともいうべき旧字の多い作品の入力校正を皆が避けるようになってしまうから、良くないんじゃないかな

793 :無名草子さん:2022/12/15(木) 22:43:06.96 .net
字形や表記にこだわる人は編集行為を嫌悪していると思う。
しかし編集があるから本になるし青空文庫にも載る。
包摂適用も編集行為のうちで、問題があるとは思わない。

794 :無名草子さん:2022/12/15(木) 22:58:32.39 .net
本当にこの件を議論したい(動かしたい)ならば
ここより、そらもようでコメントしたほうが現実的かもね。
別にここではその話するなって意味じゃないよ。
いろんな考え方聞けて面白い

795 :無名草子さん:2022/12/15(木) 23:15:37.47 .net
極稀に直筆原稿複写版の本あるよね

796 :無名草子さん:2022/12/15(木) 23:44:46.92 .net
包摂適用はやむを得ずそうしてるだけで
青空文庫の基本的なスタンスは底本の尊重にあると思ってるから
SJISよりUTF-8のほうがそのスタンスにかなうならそうした方がいいとは思う
でも結局UTF-8にしたところですべての漢字が表示できるわけではないから、どこかで妥協する必要があるのは同じなのよね

運営も割と長年このことは議論してるんじゃなかったっけ
今のところSJISで行くんだろうけど、そのうちUTF-8対応になっても驚きはしないかな

797 :無名草子さん:2022/12/15(木) 23:56:12.80 .net
青空文庫とShift_JISとUnicodeの関係については前スレでもちょっと話してたね

https://mevius.5ch.net/test/read.cgi/books/1556609356/778
https://mevius.5ch.net/test/read.cgi/books/1556609356/779

798 :無名草子さん:2022/12/16(金) 00:07:35.72 .net
https://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html

「質疑応答では、青空文庫のデータにはシフトJISコードが用いられているため、海外の方がファイルを開くと文字化けしてしまうなどの問題が指摘された。Unicodeを採用すると、旧字をどうするか? などのルール変更が必要なので、これからの青空文庫の課題として考えていきますという回答がなされた。」

2017年の講演でこういう話は出てるから、運営もSJISのままでいることが最善最適とは思っていないとは思う。だからって将来的に変わるかどうかまではわからないけど。

799 :無名草子さん:2022/12/16(金) 06:23:38.82 .net
>>793
誰も編集を嫌悪してなどいない
工作員が無難に編集できる作品しか選べない現状の仕様が問題なんだよ
熟練の工作員ほど無意識のうちに避ける習慣ができてしまっている

800 :無名草子さん:2022/12/16(金) 06:40:18.78 .net
底本のある文字を青空文庫で利用可能な異体字に変えた場合は、変えたことを認識できる仕組みがないと、情報を捨てる破壊行為に貢献する皮肉な結果になる
たとえそれが善意だったとしても

801 :無名草子さん:2022/12/16(金) 07:00:36.70 .net
モリカケ問題からもわかるように、改ざんしたことではなく改ざん履歴が失われることが問題の本質

802 :794:2022/12/16(金) 08:58:58.18 .net
>>794
そらもようにコメントつけられるんですか?
青空文庫の将来について一番活発かつオープンに議論できる場って
ここだって思ってるんですが他にもアプローチの仕方があるなら
教えて欲しいです

803 :無名草子さん:2022/12/17(土) 13:57:35.88 .net
包摂適用による字の改変が問題なら今まで包摂適用してた字も外字扱いにして注記でなんとかすれば文字コードのシステム変えなくても対応はできるな(工作員の作業量は増える)

804 :無名草子さん:2022/12/17(土) 17:47:57.67 .net
そこまで厳格にしていくと「そもそも(複数ある場合に)その底本の選別は正しいのか」という問題にまで発展していく
少なくとも現時点で青空文庫に収録されてる作家のほとんどは直筆原稿がオリジナルであって、初出誌の時点で多かれ少なかれ出版用に改変されたものでしょ
それで活字状態のオリジナルとして初出誌に限定しようとしても誤植のリスクがあるし全ての作品で直筆原稿まで直接確認できるとは限らない

805 :無名草子さん:2022/12/19(月) 12:41:23.39 .net
話題に上がりさえしない変体仮名

806 :無名草子さん:2022/12/19(月) 12:46:43.46 .net
尾崎紅葉 鬼桃太郎

807 :無名草子さん:2022/12/21(水) 17:42:59.41 .net
>>805
話題にすればいいじゃない

ついでなので関連質問させてください
青空文庫・外字注記辞書【第八版】にある、合字の「シテ(U+2CF00)」は、本来は「〆(U+3006)」とは別のものらしいんだけど、青空文庫では同じ?

808 :無名草子さん:2022/12/21(水) 19:40:33.38 .net
確かに外字注記辞書では

※[#シテ]〆 入力可能

となってるけど
ウィキペディアでは混同されてるけど別物と説明されてるな

して - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%97%E3%81%A6

809 :無名草子さん:2022/12/21(水) 19:52:47.49 .net
※「シテ」「トモ」の合字は、仮名にあらためました。

図書カード:蟻説 (高木 貞治)
ttps://www.aozora.gr.jp/cards/001398/card53028.html

※「シテ」の合字は、仮名にあらためました。

図書カード:北越雪譜 (鈴木 牧之 山東 京山)
ttps://www.aozora.gr.jp/cards/001930/card58401.html

合字を仮名に改めるパターンが少ないから〆で代用してるのかね
代用というか誤字だろうけど

810 :無名草子さん:2022/12/22(木) 12:54:41.67 .net
2023年1月1日に1927年以降の著作物がアメリカのパブリックドメインに、「シャーロック・ホームズ」短編集・映画「メトロポリス」・ヒッチコック作品などなど - GIGAZINE
ttps://gigazine.net/news/20221221-public-domain-from-2023/

Public Domain Day 2023 | Duke University School of Law
ttps://web.law.duke.edu/cspd/publicdomainday/2023/

811 :そらもよう:2022/12/23(金) 07:38:46.52 .net
2022年12月23日 青空文庫の新サーバーおよび新システムの導入に際しての充電期間の設定について
https://www.aozora.gr.jp/soramoyou/soramoyouindex.html

812 :無名草子さん:2022/12/23(金) 10:38:23.94 .net
入力申請は今年中に、ということかな

813 :無名草子さん:2022/12/23(金) 12:30:33.73 .net
いやもう送るなよ

814 :無名草子さん:2022/12/23(金) 13:06:41.82 .net
別にいいんじゃないの、来年の1月1日からだからまだ間に合う
ダメだったらダメって書くだろうし

815 :無名草子さん:2022/12/23(金) 15:51:48.65 .net
1月1日から新プロジェクトに本腰入れたいって話だろうから、
今から受付作業が来年へずれ込む程の大量申請が押し寄せたら意味がないよ

816 :無名草子さん:2022/12/23(金) 20:50:51.07 .net
>>811
わらった。
事業は休んだら終わり。このまま無くなるだろうに1ユーロ。

817 :無名草子さん:2022/12/23(金) 21:13:50.45 .net
休んでないわけだが

818 :無名草子さん:2022/12/23(金) 21:15:21.00 .net
>>814
ダメだったらダメって書く
じゃなくて
申請は年内にお早めにって書いてない
って解釈しなよそこは

819 :無名草子さん:2022/12/23(金) 21:27:00.94 .net
新たな特務チームってどんなんだろうな。
したっぱ新入り工作員だからノウハウ教えてもらえるならありがたい

820 :無名草子さん:2022/12/23(金) 21:28:38.48 .net
出す・・・・・・!出すが・・・・・・今回まだその時と場所の指定まではしていない
そのことをどうか諸君らも思い出していただきたい つまり・・・・
我々がその気になれば金の受け渡しは10年20年後ということも可能だろう・・・ということ・・・・!

821 :無名草子さん:2022/12/24(土) 01:11:28.33 .net
運営が「通常の作業ペースが保てなくなっている」って訴えるほどだから
もう申請しないほうがいいんじゃないの

822 :無名草子さん:2022/12/24(土) 01:47:55.36 .net
>>814
1月1日に言えば済むことをわざわざ1週間前に色々と事情を説明して通告してる時点で気付けよ

823 :無名草子さん:2022/12/24(土) 02:13:21.27 .net
>>822
1月1日直前までは受け付けるってことだよ

824 :無名草子さん:2022/12/24(土) 02:51:06.39 .net
受け付ける(1年間放置)

825 :無名草子さん:2022/12/24(土) 03:18:01.92 .net
そらもようで告知を出す前に届いた申請やファイルの処理の途中で今年が終わるだろうから、1日で点検と公開準備が終わるような短編の校了作品が駆け込みで届けば来年の公開作品が増やせてラッキー、くらいの猶予期間でしょ

それこそ現状では対応が間に合わないとちゃんと言ってるし、12月31日までに全部対応するとは言ってないんだから、他は放置でも全く問題ない

826 :無名草子さん:2022/12/24(土) 06:21:04.28 .net
入力申請は他の人と被らないようにする宣言みたいなもんだから、ひとりで長編作品とかやるつもりならちゃんと入力申請しとけばいいと思うよ

827 :無名草子さん:2022/12/24(土) 13:06:04.92 .net
今年工作員になったんやけど今思えば滑り込みでいろんな作業やれたんやなと思う
休止期間の特務チームって教育係みたいなのがつくのかな。年明けの詳細が気になる

828 :無名草子さん:2022/12/24(土) 13:06:13.13 .net
>>819
自分の知識のためだけで
組織のために働けない冷やかしならやめて欲しい

829 :無名草子さん:2022/12/24(土) 13:29:48.34 .net
工作員やってる時点で「自分の知識のためだけ」ではないやろ
青空文庫のノウハウとか青空文庫以外では使おうにも使えないし
なんでかここもギスギスしてるね。急な発表だったからかな

830 :無名草子さん:2022/12/24(土) 13:36:05.06 .net
特務チームのことを読んで最初に思ったのがそれなんだよ

受付点検グループへの門戸はずっと開かれていたんだよ、今までも
でも叩くものが(多分ほとんど)いなかった

それを特務チーム結成と聞いてガヤガヤと集まる人々にどれだけの熱意と継続力があるのか
鍛えるだけ鍛えたチームメンバーがある日突然なしのつぶてじゃ、組織のためにならない

滅私奉公で名前も知られず継続的に仕事をしている点検グループ
興味は持ったけど内容を聞いてやっぱり自分には無理です、とはっきり辞退するならいいが
頭数だけ増えて幽霊メンバーじゃ意味ないから
加わるならしっかり責任もって加わりたい

831 :無名草子さん:2022/12/24(土) 13:36:37.87 .net
【3回目】 追加接種 =⇒ 死者増加 【4回目】
//kizuna.5ch.net/test/read.cgi/hikky/1667019659/l50
https://o.5ch.net/204mv.png

832 :無名草子さん:2022/12/24(土) 13:38:31.87 .net
>>829
自分の作業のしやすさだけ
と置き換えると解ると思う

833 :無名草子さん:2022/12/24(土) 13:42:31.60 .net
第一現役工作員自体がそんなに居ないんだからガヤガヤ集まるというほど集まりはしないだろう
そこまでの熱意ある人だけじゃ先細るから裾野を開くためにこういうことしてるんじゃないかと思ったけどな。

834 :無名草子さん:2022/12/24(土) 13:45:12.97 .net
むしろただ門を開いてるだけじゃ入らないからこそ改めて宣伝してるんでしょ

835 :無名草子さん:2022/12/24(土) 13:55:05.66 .net
ギスギスも何も、「もう手が回らないので来年から休みます」って年末になってようやくNOやSOSを言えるようになった人に対して「今年はまだ残ってるな」で相手に負担をかけようとするのは、単純にブラック企業顔負けの発想過ぎるし、それに対して批難する奴が出るのは自然の流れだと思う

836 :無名草子さん:2022/12/24(土) 14:07:38.90 .net
それなオブそれな

837 :無名草子さん:2022/12/24(土) 14:32:43.32 .net
好きにすりゃいいさ
そもそも金は絡まず名前が付くという名誉しかないんだ

838 :無名草子さん:2022/12/24(土) 14:43:16.11 .net
点検さんはそれ(名前がつく名誉)すらないのにやってくれてるのに

839 :無名草子さん:2022/12/24(土) 14:44:54.91 .net
金が絡まなきゃ好きに振る舞っていいわけじゃない

840 :無名草子さん:2022/12/24(土) 14:49:15.02 .net
>>835
一個人が運営してるわけじゃないので、そんな配慮は無用だよ
なんか勝手に青空文庫の管理グループを一個人に人格化してる人いるみたいだけど、
むしろそういう人は自身の心の病気を疑ったほうがいい。自己投影なのかもしれんが

841 :無名草子さん:2022/12/24(土) 14:52:00.41 .net
マナー奉行みたいな書き込みしてる人、心病んでるんじゃないの?マジで

842 :無名草子さん:2022/12/24(土) 14:58:49.09 .net
>>839
常識はずれがタマにこうして現れるから
電子レンジでネコを乾燥させないでくださいとか取説に書く必要があるんだな
日本人でもこうした程度が低いやつが現れると困る

843 :無名草子さん:2022/12/24(土) 15:01:14.13 .net
>>838
客観的に見て作業の大変さは点検の方だから連名したらと思うが
どの程度点検してるのかわからないから難しそう
自己申告系はほんま難しいな

844 :無名草子さん:2022/12/24(土) 15:02:19.75 .net
好きに振る舞っているのはむしろ青空文庫のほうなんだが
なんか教祖を擁護するM信者みたいな書き込みしてる人、マジでヤバい

845 :無名草子さん:2022/12/24(土) 15:04:14.59 .net
>>844
暖簾に腕押し見たいな何言ってるのかわからん
ある意味白昼夢みたいな主語置いてきぼりな言葉はこのスレに合いませんよ

846 :無名草子さん:2022/12/24(土) 15:06:14.95 .net
未着手タスクの山になっても平然としていられるような手合いが青空文庫の中の人たちなんだが、
なんかこのスレに忖度要求を書き込む人は、自分が繊細だから青空文庫の中の人も繊細なはず、と勝手に思い込んでてキモイ

847 :無名草子さん:2022/12/24(土) 15:31:06.11 .net
青空文庫の中の人たちを直接的に知ってて言ってるのかイメージで言ってるのかが気になるところ

848 :無名草子さん:2022/12/24(土) 15:38:44.43 .net
>>846
平然としてると思ってるのか……
それこそ自分の面の皮が厚いから
中の人も厚いはずと思ってるのね

849 :無名草子さん:2022/12/24(土) 15:47:23.15 .net
>>848
入力者への影響が大きい「充電期間の設定」の告知をわずか1週間前に行うくらいだから、中の人はメンタル強者そのものだよ
中の人だけじゃなく入力者もボランティアなわけで、それをわかったうえでやるのだから

850 :無名草子さん:2022/12/24(土) 15:50:01.66 .net
まぁ一般工作員にとっては点検作業や点検グループって謎な部分は大きかったから
休止期間の施策として点検について教えてくれるならありがたい話だな
点検グループにとって何が迷惑で迷惑じゃないのかとかは想像するしかない部分も多いし
点検グループに回らない工作員にとっても、点検グループがどんなふうに作業を回してるのか分かれば気を遣いやすくなると思う

851 :無名草子さん:2022/12/24(土) 15:51:48.88 .net
>>840
むしろ集団が分担してやってるのに全然間に合ってないんだから個人でやってるより問題は深刻だろ

852 :無名草子さん:2022/12/24(土) 15:57:09.43 .net
>>851
いきなり倒産を発表する企業とかはまさにそんな感じだね

853 :無名草子さん:2022/12/24(土) 16:00:08.00 .net
そもそも「大量申請は控える」って公式に明文化されていますし
無視するわけにいかんでしょ

854 :無名草子さん:2022/12/24(土) 16:01:01.87 .net
正直年単位で参加しててここ半年くらいにも連絡を取った工作員なら何となく運営チームが限界を迎えてそうという察しはついてたよな

855 :無名草子さん:2022/12/24(土) 16:09:17.33 .net
突如夜逃げして債権者に迷惑かける人を面の皮が厚いとみなすかどうかだね
夜逃げした本人は面の皮が厚いとは思っておらずむしろ、自己憐憫してたりする

856 :無名草子さん:2022/12/24(土) 16:17:08.82 .net
そもそも青空文庫は紙の出版物と違ってWebなのだから公開しながら適宜修正していけるはずなんだよ
点検グループはなにを点検しているのか、という話にもなるわけで

857 :無名草子さん:2022/12/24(土) 16:22:37.48 .net
テキストファイルの管理はGithubでしてPR受け付ければよくね?、みたいな話は出てこないもんなのかな
中の人の思考様式が、時代遅れになってないか?

858 :無名草子さん:2022/12/24(土) 17:01:08.51 .net
>>856
「とりあえず公開して、間違いや不備に気付いた段階で適宜修正すればいい」という手法の妥当性や有効性はWikipedia見てたら何となくは分かると思うけど

859 :無名草子さん:2022/12/24(土) 17:16:06.41 .net
>>858
Wikipediaは誰でも彼でも書き換えできてしまうので論外
修正を受理するか確認できるGithubのPR(Pull Request)機能を使えばそういった問題は起きない

時代遅れな人は時代遅れであることに気づけない

860 :無名草子さん:2022/12/24(土) 17:21:16.03 .net
どこかでgithub自体がもはや時代遅れって見て
一時は真面目に学んでみようかなんて思ってた気持ちが
一気に萎んだんですが実際のところはどうなんでしょうか?

861 :無名草子さん:2022/12/24(土) 17:25:42.33 .net
Githubを使えば、一般ユーザーは管理者ユーザーから修正内容を却下されてもめげずに独自に修正作業しつづけることができる
このプログラミング業界のソース管理技術を青空文庫が応用しない手はないよ
バックアップや履歴管理の負担はかなり減るからね

たぶん充電期間に、そういう話されるはず、と思いたい

862 :無名草子さん:2022/12/24(土) 17:43:48.29 .net
>>860
Githubが時代遅れという情報源はどこでしょうか
いまやマイクロソフト社までもがGithub使っています
個人的には、有力な代替手段が見つからないうちはGithubは時代遅れではないと思いますよ

863 :無名草子さん:2022/12/24(土) 17:47:58.58 .net
どなたもメリークリスマス
来年は吉報があるよ

864 :無名草子さん:2022/12/24(土) 17:50:38.43 .net
>>856
点検グループは情報や権利の正当性も合わせてチェックしている
ただ底本にそったテキストを作るだけのわれわれとは作業の性質が違うのだからそんな風に言わないで欲しい

865 :無名草子さん:2022/12/24(土) 18:07:45.21 .net
>>864
点検グループへの同情や忖度なんて一切必要ない
点検グループが作業を可視化しければ、無能な貴族呼ばわりされる。それだけ

866 :無名草子さん:2022/12/24(土) 18:13:12.88 .net
>>859
それを公開前に前倒しで全文を対象として1回やってるのが今の「公開前に入力者と点検者以外による校正作業を入れる」という手法だよね
それでも漏れがあるから誤植があったら底本の画像付きで連絡くれって言ってるんだし

867 :無名草子さん:2022/12/24(土) 18:44:43.17 .net
>>865
点検作業で何をしているかについては既に可視化されてるけどね
相手が情報を公開しても確認しない調べもしない人は何て呼ばれるのかな?

青空文庫はこうやって運営され、こうやって活用されてます - 鷹野凌のデジタル出版最前線 - 窓の杜
ttps://forest.watch.impress.co.jp/docs/bookwatch/digipub/1090529.html

青空文庫20周年記念シンポジウム「青空文庫の今とこれから」:チュートリアルセッション 青空文庫の仕組みとボランティア入門 - YouTube
ttps://www.youtube.com/watch?v=0VW7HG-vQlY

青空文庫20周年記念シンポジウム「青空文庫の今とこれから」
ttps://www.aozora.gr.jp/houkokusyo/aozora20anniv.html

868 :無名草子さん:2022/12/24(土) 18:52:18.97 .net
>>867
言葉遊びしたいの?
スローガンを見せることが可視化ではないよ
日々の点検の進捗を可視化しなければ意味がないでしょ

869 :無名草子さん:2022/12/24(土) 18:56:18.53 .net
>>868
こっちの話?

青空文庫の作業状況
https://yozora.main.jp/inp/index.html

870 :無名草子さん:2022/12/24(土) 19:49:20.25 .net
言うほどスローガンか?

871 :無名草子さん:2022/12/24(土) 19:49:43.59 .net
アプリ開発できるような人が参加してくれると良いな
それか
青空文庫アプリ会社に向けて文字ミス通報機能追加してもらうとか
こういうのを読者にも頼めればずいぶん楽になると思う

872 :無名草子さん:2022/12/24(土) 19:50:25.73 .net
ミス
青空文庫アプリ会社 → 青空文庫対応アプリ開発者

873 :無名草子さん:2022/12/24(土) 20:17:07.54 .net
>>862
github でググった時に検索候補に危険性って出てきて
記事を読んでる中にそのようなことが書かれてたんです
便利そうで覚えたいと思っていたのですが

874 :無名草子さん:2022/12/24(土) 21:14:52.54 .net
>>869
「入力予約」の状態ってどうなってんの?

入力予約 : 3件
2008年:1件
2003年:1件
2002年:1件

875 :無名草子さん:2022/12/24(土) 21:42:14.76 .net
そうなってるんだよ

876 :無名草子さん:2022/12/24(土) 21:46:58.74 .net
>>852
状況としてはこれに近いと思う
厳密に言うと青空文庫は本の未来基金とかもあって経済的には一応余裕があるけど運営の人手が圧倒的に足りないというのが根本的な問題だから倒産(≒サイト閉鎖)の危機はないんだが

877 :無名草子さん:2022/12/24(土) 21:47:04.84 .net
校了後が長すぎる作品についてはどういう理由があるのか疑問視する意味はあるが
ほかのステイタス、それも著作権切れ延長に係るような作家作品でもないのなら、想像するだけ無駄

878 :無名草子さん:2022/12/24(土) 21:53:10.78 .net
少なくとも2010年以前に校了状態になってる作品は公開前までに共著者や戦時加算の都合で著作権法保護期間中と判明されてるものだよ
それ以降は公開準備中のものと法改正で保護期間延長になったものが入り交じってる

879 :無名草子さん:2022/12/24(土) 21:58:41.09 .net
>>878
だったよね。

ほかのステイタスについては個人か運営の都合としか言えない。

誰かが代打を申し出ることはできるし、長期放置が気になるなら代わってあげてもいいんじゃ?

二十年も前となると可能性としては本人さんが存命かどうかも疑わしい。
青空文庫の歴史が長くなればこれからこういうことは増えていくと思う。

880 :無名草子さん:2022/12/24(土) 22:09:42.59 .net
冗談じゃなくてNPO法人化した方が良いともう

881 :無名草子さん:2022/12/24(土) 22:36:33.00 .net
とりあえずマナー奉行と忖度強要奉行は全員氏んでくれ

882 :無名草子さん:2022/12/24(土) 22:39:47.34 .net
>>881
とっくに引っ込んでるものを蒸し返すな

883 :無名草子さん:2022/12/24(土) 22:58:33.72 .net
忖度したら死ぬのか
忖度に親を殺されたのか
ってくらいの憤怒

884 :無名草子さん:2022/12/24(土) 23:13:18.68 .net
来年の公開頻度は毎週日曜日くらいになるのかな

885 :無名草子さん:2022/12/24(土) 23:20:13.77 .net
お正月特別公開とかあんのかな

886 :無名草子さん:2022/12/24(土) 23:43:11.07 .net
入力予約は昔の制度っぽいけどサイト内検索してもいまいち分からんな

887 :無名草子さん:2022/12/25(日) 00:18:57.77 .net
質問です
なり、ナリの仮名、青空文庫・外字注記辞書(大八版)には見当たらないようなのですが、ご存じの方いませんか?

なり (仮名) - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%AA%E3%82%8A_(%E4%BB%AE%E5%90%8D)

888 :896:2022/12/25(日) 00:20:50.03 .net
URLが間違っていたみたいなので張り直し

なり (仮名) - Wikipedia
https://ja.wikipedia.org/wiki/%E3%81%AA%E3%82%8A_%28%E4%BB%AE%E5%90%8D%29

889 :無名草子さん:2022/12/25(日) 00:35:31.22 .net
>>887

• 「コト」「より」以外の合字は現代平仮名、カタカナで入力して、ファイル末に下記のように注記してください。
※「シテ」「トモ」「トキ」「こと」「ごと」「まいらせそうろう」の合字は、仮名にあらためました。
• 仮名に書き換えるのではなく、外字注記したい合字は下記を参考にたとえば「※[#シテ、ページ数-行数]」のように本文中に注記してください。


……と外字注記辞書に書いてあるからそれに準ずる

890 :896:2022/12/25(日) 00:53:21.16 .net
>>889
回答、ありがとうございます

891 :無名草子さん:2022/12/25(日) 00:59:41.88 .net
外字注記辞書の更新も点検グループの仕事のひとつ。

892 :無名草子さん:2022/12/25(日) 01:24:24.33 .net
最新の外字注記辞書は第8版か

893 :無名草子さん:2022/12/25(日) 14:06:26.08 .net
Unicodeへの移行とかも行われるのかね

894 :無名草子さん:2022/12/25(日) 14:20:22.00 .net
かもね
積年の課題をやっつけるためにはいい機会だ
なにかできることがあったら加わりたい

895 :無名草子さん:2022/12/25(日) 14:37:38.07 .net
入力中→校正待ち
校正中→校了

この間に、「点検はしていないが受領はした」というモードが欲しいなあ
「校正待ち(点検前)」というモードもあるけれど、これはほとんど機能していなくて
入力者自身が中の人の場合くらいしか使われてないんじゃないかな

耕作員としては自分の手を一旦離れたものなのに
ずっと自分のところで○○中のまま停滞しているように見えるのこそ悲しけれ

896 :無名草子さん:2022/12/25(日) 18:01:40.00 .net
今はJIS X 0213以外の漢字を含む青空文庫の作品内キーワードはWeb上に存在しないも同然の扱いになってる
Unicode対応するとJIS X 0213以外の漢字を含む作品内キーワードの多くをGoogleなどの検索エンジンが認識できるようになる

897 :無名草子さん:2022/12/25(日) 18:14:29.25 .net
Googleを引き合いに出してUnicodeを化が必要という話がたまに出るけど
むしろGoogleのほうが青空文庫形式に対応すべきじゃないの
と思う

898 :無名草子さん:2022/12/25(日) 18:20:01.95 .net
>>897
それやると、かえって逆に青空文庫側が自由に仕様変更できなくなるよ
青空文庫がhtml外字の仕様変更するたびに検索エンジンから見えなくなるからね
そういう二度手間なくすためのUnicodeってこと

899 :無名草子さん:2022/12/25(日) 18:27:10.66 .net
青空文庫が出版業界と共存できる差別化は、せっかく紙で再版しても旧字旧仮名だらけで一般読者にはとっつきにくくて採算とれそうにない旧作の電子化だからUnicode対応待ったなしなんよ

900 :無名草子さん:2022/12/25(日) 22:05:27.21 .net
>>802
今さら亀レスですが
そらもようじゃなくてaozorablogの間違いでした
すみません充電してきます

901 :無名草子さん:2022/12/25(日) 23:20:37.34 .net
ママ注記にUnicode文字注記含んでるとつまりPageOneでエラー扱いになるからさっさとUnicode対応してほしい

902 :aozorablog:2022/12/26(月) 20:41:32.07 .net
『するりと鏡を――ぬけてみて、アリスの目に見えたもの』第2章
https://www.aozora.gr.jp/aozorablog/?p=5128

903 :無名草子さん:2022/12/26(月) 21:36:13.63 .net
Unicodeとかもそうなんだけど作家・作品・底本(出版社や時代)を跨いだ全ての文章の一括検索という観点からすると
例えば「ほぼ」と「ほゞ」と「略」と「略々」と「略※[#二の字点、1-2-22]」みたいに表記揺れのある単語や言い回しをそれぞれの底本に準拠させる必要性がどこまであるのかみたいな問題にもなってくると思うんだよね
(他にも小書きかどうかだったり新字と旧字みたいな区別も出てくる)
それを検索サイトやシステム側で一緒にできるならいいんだけど

904 :無名草子さん:2022/12/26(月) 21:56:54.15 .net
表記揺れはand検索でどうとでもなるからそのために本文を改変する必要はないと思うな

905 :無名草子さん:2022/12/26(月) 22:12:08.36 .net
それがどこまで網羅できるのかって話だけどね
データベースでも作るなら別の話になるけど

906 :無名草子さん:2022/12/26(月) 22:42:57.71 .net
当たり前だけどUnicode対応するといままで包摂適用してきた多くの文字をそのまま使えるようになるので外字注記辞書の更新も必須

907 :無名草子さん:2022/12/26(月) 22:57:50.51 .net
>>903-905
今まで、それを比較検証することすらできなかったわけで、
「HD画質は皺が目立つから良くない」みたいな後ろ向きな現状維持は見苦しい

908 :無名草子さん:2022/12/27(火) 03:09:19.99 .net
検索ツールの責をデーターに帰してどうすんだ。

909 :無名草子さん:2022/12/27(火) 03:38:57.56 .net
>>908
誕生から25年経ったのに、青空文庫の書式に対応した検索ツールが皆無という現実がすべてを物語ってるでしょ

910 :無名草子さん:2022/12/27(火) 03:49:22.35 .net
データーの責を検索ツールに帰してどうすんだ。

911 :無名草子さん:2022/12/27(火) 10:17:59.51 .net
https://csd.ninjal.ac.jp/lrc/index.php?%C1%B4%CA%B8%B8%A1%BA%F7%A5%B7%A5%B9%A5%C6%A5%E0%A1%D8%A4%D2%A4%DE%A4%EF%A4%EA%A1%D9/%A5%C0%A5%A6%A5%F3%A5%ED%A1%BC%A5%C9/%A1%D8%C0%C4%B6%F5%CA%B8%B8%CB%A1%D9%A5%D1%A5%C3%A5%B1%A1%BC%A5%B8
既に青空文庫の全文検索コーパスは存在しますよ

912 :無名草子さん:2022/12/28(水) 01:12:10.34 .net
「大岡政談」は、テキストファイルのサイズが青空文庫唯一の2MB越えで、ルビが75892個もあるんだね
今、未申請ながら入力してる作品もルビ35000個を超えているんだけど、上には上がいるってことでちょっと安心した

913 :無名草子さん:2022/12/28(水) 12:10:04.65 .net
画像生成AI「Stable Diffusion」で青空文庫の名作小説に挿絵をつけてみた!【特集・集中企画】 - 窓の杜
https://forest.watch.impress.co.jp/docs/special/1466561.html

914 :無名草子さん:2022/12/28(水) 12:40:06.43 .net
>>913
タイトルは面白いと思ったが本文くっさ
漫画☆太郎の100%パターンマンガとどちらが下だろうと悩むほどに

915 :無名草子さん:2022/12/29(木) 18:44:44.53 .net
底本のページ番号に特化した注記があればいいなあ
外部プログラムに底本のページ番号を渡すことで該当する画像ファイルなりPDFなりをすぐに開けると校正が楽になると思うんだが

916 :無名草子さん:2022/12/30(金) 16:52:31.43 .net
来年は溜めてる作業を消化しような

917 :925:2022/12/30(金) 16:57:45.24 .net
「来年は」というか「来年こそは」だわ

918 :無名草子さん:2022/12/30(金) 17:11:21.75 .net
来年は一体どうなるんだろうねぇ
まだ新年の公開作品の情報も出てないから完全に更新止まっちゃうのかな……

919 :無名草子さん:2022/12/30(金) 19:22:38.00 .net
未申請のまま入力に取りかかろうかと考えている
もしも他の人と作業がダブってしまってふいになったとしても
自己責任、自業自得ってことで

Unicode化や注記の仕方など
大きな仕様変更があるかもしれないが
それでも一年間なにもせずにいられそうもない

920 :無名草子さん:2022/12/30(金) 20:19:48.47 .net
2022年12月23日に出された充電期間の通知よりも前に申請したんだが、未だに連絡メールが来ない
まだ4週間経ってないから待ってるけど、どうなるのかな

>>919
重複を回避できる仕組みがあればいいんだけど、やたら申請だけしてほったらかしにされると困るので、
青空文庫の中の人による集中管理によらない、入力者間のゆるい情報交換の仕組みがあればいいと思う。
Githubのissue機能(メール通知や状態管理できる2chスレッドみたいなもの)を使えば作品ごとに重複回避や作業分担できそう。

921 :無名草子さん:2022/12/30(金) 20:25:16.14 .net
ググルのような工程表を用意し
この通りにやらないと優先度が落ちて行って最終的には申し込み自体消滅でいんちゃうの

922 :無名草子さん:2022/12/30(金) 20:32:17.11 .net
>>921
言いたいことはなんとなくわかるよ
けど、ガントチャートはスケジュールを中央で一元管理する人がいて始めて成り立つものなので、
ガントチャートの逐次更新にこだわると青空文庫の中の人の仕事が逆に増えてしまう恐れがある
毎日のようにたくさんの作品が放り込まれてくる青空文庫には、なじまないかもしれない

923 :無名草子さん:2022/12/30(金) 20:36:46.66 .net
参加者皆で確認して行く方向が大事だと思う
管理者は10名ほど横繋がりでやり取りできる状態になると良いな

924 :無名草子さん:2022/12/31(土) 08:52:43.28 .net
2023年も山周祭りか?

925 :無名草子さん:2022/12/31(土) 12:19:09.33 .net
その話題は荒れるもとだからやめよう

926 :無名草子さん:2022/12/31(土) 13:35:20.67 .net
中の人もここ見てくれてるのだろうか?
だとすればここでブレインストーミング的にたくさん意見を出しておくと何かに活かされるかもしれんという希望が

927 :無名草子さん:2022/12/31(土) 16:05:03.93 .net
工作員のみんな今年もお疲れ様
来年は色々変化があるのだろうけどぼちぼちよろしく

928 :無名草子さん:2022/12/31(土) 20:10:48.61 .net
皆の活動が名作を支えてる
読者として楽しんでます

青空読んでたら何でか文庫本も買うようになって
変な逆転現象も出てる

929 :無名草子さん:2023/01/01(日) 05:18:51.35 .net
みんなあけおめ

2023年01月01日 『電子アーカイヴ』はしばし電気をためて夢を見る
https://www.aozora.gr.jp/soramoyou/soramoyouindex.html#000527

930 :無名草子さん:2023/01/01(日) 17:38:48.70 .net
>>928
うれしいよ、ありがとう!

931 :無名草子さん:2023/01/01(日) 20:06:27.66 .net
昨年で校了になっている作品は、今「校了」になってるので全部なのだろうか
いま点検グループさんの手元にある作品は、いったん作業中止って扱いになるのだろうか
(入力校正の新規受付がストップするのは分かったけど……)

932 :無名草子さん:2023/01/01(日) 20:13:25.98 .net
>受領後点検と「校了」ステータスの完全再開は、新データベースシステムの本運用開始と高品質ファイル作成に目処がついてから

そういうことだろうね。
運用システムが万全になるまでは、「校了」に移行することはないということ。

なぜなら高品質ファイルにするために何らかの仕様変更をする可能性があるし、
そうなれば、すでに送ったファイルでも、校正者に再度返す必要がある。

933 :無名草子さん:2023/01/01(日) 20:16:11.34 .net
校了したら、点検グループは必ず当日中に校正者にお疲れメールをくれる。
それがないということは
昨年中の校了作品は、今データベースで「校了」になったものがすべてで、あとは作業停止と思ってよいはず

934 :無名草子さん:2023/01/01(日) 20:18:21.64 .net
自己レスごめん

>>933
>それがないということは

上の質問者さんが心配しているのは
「昨年中に自分の送った校正ファイルはどうなっている(どうなる)のか?」
ということだろうと想像して答えた。

935 :無名草子さん:2023/01/01(日) 21:34:25.53 .net
>>931です。
ありがとうございます。
私は特に自分の担当している作業中作品はありませんが、
(いちおう一作品だけ入力申請していましたが未回答)
昨年の内に校正中になった自分の担当作品が多く、
それらが今後どうなるのか気になってました。

初心者の方が校正している様子も見受けられるので、
混乱が生じないことを祈りたいです……

936 :無名草子さん:2023/01/01(日) 21:43:45.15 .net
今月の予定は?

937 :無名草子さん:2023/01/01(日) 21:57:33.56 .net
>>935
あまり新人を敬遠する発言はしないでほしい
新人でも精力的な人は精力的だし
点検Gもサポートしてる

938 :無名草子さん:2023/01/01(日) 21:59:23.15 .net
十年以上校正者がいない作品もあるのに
手を上げて校正してもらえる人が現れただけ幸運だよ

939 :無名草子さん:2023/01/01(日) 22:08:27.84 .net
厳格にやるべきは著作権など権利の確認で、校正はそれほど厳格にしなくても良いと思うんだが、
「ウォーリーを探せ」よろしく、入力間違いを沢山見つけた強者を月間・年間ランキング表示するゲーム感覚でいいんじゃないの。
ま、暴論だけどさ

940 :無名草子さん:2023/01/01(日) 22:39:28.25 .net
>>937
そうですね。
申し訳ございません。
私も参加したのは近年からですので、どちらかと申せば初心者です。

今回のリニューアルを機に、
いまだ校正されていない作品に光が当たりますように。
長文作品は「ドグラ・マグラ」のように交流しながらグループで行えるのが理想ですね。

941 :無名草子さん:2023/01/01(日) 23:14:39.93 .net
>>939
「歴史的仮名遣いを現代仮名遣いに改めた」とか「明らかな誤植を修正した」とか「使用する文字コードに存在しない文字を画像で挿入にした」みたいに
やむを得ない理由がないのに内容を変えて公開したら同一性保持権の侵害になるんだから内容の正確性はそのまま著作権の論点になるよ
同一性保持権などの著作者人格権は保護期間みたいな制限がないからね(著作権法60条参照)

942 :無名草子さん:2023/01/01(日) 23:36:35.04 .net
>>941
読者の視点でざっと読んで、違和感なかったらOKってことでいいんでないかな。
より細かい間違いを見つける作業は、一般人に委ねたらいいと思う。
参加型や逐次更新というWebの強みを活かさない手はない。

943 :無名草子さん:2023/01/01(日) 23:49:06.92 .net
古いファイルを見てると、工作員の独断で勝手に校閲したらしき部分を見つけることが時々ある
(底本通りではなく、別な本を見て直したように見えるが誤記注記がない、とか)
あと底本だか親本だかの版が存在しない版(発行日も刷数もでたらめ)だったこともあったな
あんまりゆるくするとそういうのが増えかねないから、校正はそれなりにちゃんとした方がいい、と思う

944 :無名草子さん:2023/01/01(日) 23:53:58.96 .net
>>942
OKなわけないじゃん
むしろ悪質だろ

調べに調べた上での誤りは致し方無い部分もあるかもしれないが
他人の書いた文章をお前の怠慢で改竄して公開する権利は無い

945 :無名草子さん:2023/01/01(日) 23:56:48.77 .net
逐次更新と簡単に言うけど
少なくとも従来のシステムでは
技術的にも人手的にも簡単なことではなかった

それに青空文庫は出鱈目で信頼性が低いと酷く叩かれた過去だってある

新システムでファイル差し替えがどの程度容易になるかは分からないが、
それに甘んじず校正はきちんとやって信頼度の高いものを提供した方がいい

946 :無名草子さん:2023/01/01(日) 23:58:02.24 .net
>>944
え?
すでに次世代デジタルライブラリーでOCRによって改竄(いわゆる誤検出)された作品が大量に公開されてるよ
「悪質」かどうか誰が決めるの?

947 :無名草子さん:2023/01/02(月) 00:00:25.46 .net
というか951は工作員なのか読者なのかどういう立場で言ってるのか気になる

工作員だったら自分の作業には責任も誇りも持って受け持ってると思うので、なかなかこの発想にはならんと思うんだな

948 :無名草子さん:2023/01/02(月) 00:03:05.72 .net
>>946
次世代デジタルライブラリーはそれ自体が研究検証目的の実験的取り組みだ

同列には語れん

949 :無名草子さん:2023/01/02(月) 00:05:00.38 .net
>>942
底本をもたずに無料で読みに来る読者に細かい間違いを指摘させるってどんな無謀な期待よ

950 :無名草子さん:2023/01/02(月) 00:06:36.71 .net
>>947
誇りを持つのは自己満足で勝手にどうぞって感じだけど、責任はなんにも背負ってないでしょ。
それとも賠償責任とか負うの?
学術論文で引用された作品が間違ってたら署名つきで謝罪するとか?
あまり言葉遊びしないほうがいいと思うよ

951 :無名草子さん:2023/01/02(月) 00:07:54.97 .net
小並感

952 :無名草子さん:2023/01/02(月) 00:19:35.24 .net
>>946
次世代デジタルライブラリーは「実験的な検索サービス」と謳ってるように青空文庫みたいな読むためのものではないし
OCRテキストと資料の画像を紐付けることによって内容の正確性を担保(補完)してる

それに公開時点で誤字・脱字・衍字があった時点で単純に悪質なのよ

953 :無名草子さん:2023/01/02(月) 00:28:34.68 .net
そのへんの感覚が希薄な耕作員がいるとしたら恐ろしい

954 :無名草子さん:2023/01/02(月) 00:31:27.81 .net
>>952
紙書籍の考えを引きずらなくていいと思うよ
間違ってたら更新すればいいだけ

紙書籍はハードウェアなので配布してしまったものを簡単に修正できないけど、
Web書籍はソフトウェアなので簡単に修正できる

青空文庫はなんの社会的責任も負っていないし、
ましてや君主でもないので「綸言汗の如し」のことわざはまったく当てはまらない

955 :無名草子さん:2023/01/02(月) 00:39:36.93 .net
君子は豹変す

956 :無名草子さん:2023/01/02(月) 00:40:19.52 .net
>>954
で、その更新(修正)前に読んだ人にはどう対応するつもりなの?
その誤字部分のせいで駄作だと思われたら確認にも来ないよね?

957 :無名草子さん:2023/01/02(月) 00:43:01.62 .net
間違ってたらデータを更新すればいいだけだからこそ公開までに何人もの目を通して修正を施してるんでしょ

958 :無名草子さん:2023/01/02(月) 01:00:08.06 .net
>>956
今も対応してないでしょ
てへぺろで十分

959 :無名草子さん:2023/01/02(月) 02:06:09.13 .net
ocrの認識率が99%だとして、百字に一字も誤字がある文章なんて読めたもんじゃないから、そのまま公開しても「ざっと読める」クオリティには到底ならないと思う
現状は「ざっと読める」ようになるまで結局誰かの校正が必要。だとすると今とそんなに手間は変わらないんじゃないか。
ocrの認識率が今後伸びればまた違うのかもしれないが。

ただ、みん翻みたいな感じでみんなで校正できたらそれはそれで楽しそうだとは思う
けどそのシステムの実装のために式年遷宮が5年くらい伸びそうな気もするな。

960 :無名草子さん:2023/01/02(月) 07:32:01.37 .net
>>945
の言う通り従来のシステムでは逐次更新そのものが面倒というのもそうだが、
青空文庫本体を更新したとしても、そこから作られて別なサーバに置かれてるファイル、
たとえばKindleで無料でダウンロードできる(赤と黄色の表紙の)ファイルなんかは
古いままだから、そっちを利用してる人は古いファイルを使い続けることになる
という問題もある(実際、青空の方は直ってるのにKindleの方だけ見て誤字がーって
愚痴ってる人を見たことがある)
よく知らんけど、公共図書館の電子図書館とかにあるファイルもそんな感じなんじゃない
だとしたらやはり現時点では公開の前に十分なチェックが必要かと思う

961 :無名草子さん:2023/01/02(月) 07:58:35.68 .net
>>960
青空文庫の最新版と同期を取る仕組みが必要って話でしょ
いつまでたっても古いままってのはどのみち問題なわけで。
公開前の十分なチェックとかやってるといつまで経っても10~20年物の待ち状態の作品をさばけないと思う

962 :無名草子さん:2023/01/02(月) 10:24:56.27 .net
複数の工作員が校正を共同で作業してるのはたまにあるよね

963 :無名草子さん:2023/01/02(月) 12:09:56.37 .net
>>958
十分じゃないから最初の公開までに点検なり校正なりしてるんだけどそれが分からないの?

964 :無名草子さん:2023/01/02(月) 12:13:37.34 .net
適当でおk派はウィキソースに行ったほうが幸せになれるぞ

965 :無名草子さん:2023/01/02(月) 12:38:50.63 .net
公開してからバグがあると問題であるとするなら

非公開サイト内で一般人に近い環境でファイルを読む、
テスターあるいはデバッガーとしての耕作員活動を募るというのはどうだろう

いずれにしてもボランティアだから
読みやすいものに査読者が偏るだろうけど

966 :無名草子さん:2023/01/02(月) 12:54:11.23 .net
OCRから読み取るのと電子ブックからコピペしたのを貼り付けるのと何が違うんだろう
文章が全く同一の場合は何も変わらないのだろうか?

967 :無名草子さん:2023/01/02(月) 13:06:45.25 .net
そりゃそうだ
同一なら同一

968 :無名草子さん:2023/01/02(月) 13:13:07.19 .net
漢数字の「二」がカタカナの「ニ」になってたりすると
ocrに読み込ませて失敗したななんてことは思います

969 :無名草子さん:2023/01/02(月) 13:31:26.32 .net
一般人から、書写者(早口で三度言えたらお前の勝ち)へ誤字をフィードバックする仕組みを作れよ。

970 :無名草子さん:2023/01/02(月) 13:55:56.90 .net
>>969
それはホントに思う
kindleとかは誤字を簡単に報告する仕組みが出来てるけど
そんな感じで「これ、おかしいんじゃない?」って思うのを
気軽に送信してチェックしてもらえると嬉しい。

ちゃんと底本確認してから報告しろと言われるとハードルが
とてつもなく上がる。

971 :無名草子さん:2023/01/02(月) 13:56:54.35 .net
たださ、青空文庫ではウィキソースと違ってママ注記を乱発しないんだよ

現代の用法と照らして間違ってるというだけでは、青空文庫ではママ注記しない

誤字通報フォームには、「□利用規約に同意します」よろしく
その旨(青空文庫の公式な「誤字、誤用」に対する考え方)理解を求めないとならんだろう

972 :無名草子さん:2023/01/02(月) 13:57:29.56 .net
>>970
殺到の予感

973 :無名草子さん:2023/01/02(月) 14:02:14.26 .net
その仕組みがないために誤字だらけの作品を公開し続けるのも
不味いのではないかなんて思うのですが
その辺は皆さんどうお考えでしょうか?

974 :無名草子さん:2023/01/02(月) 14:03:24.64 .net
自分がその気軽な連絡を受けてチェックする側にいても同じこと言えるの?

975 :無名草子さん:2023/01/02(月) 14:04:06.96 .net
>>974
言えると思いますがなにか?

976 :無名草子さん:2023/01/02(月) 14:04:40.30 .net
すげえな
俺は言えない

977 :無名草子さん:2023/01/02(月) 14:10:35.10 .net
一般読者は>>971を理解してない

だから同じ件や類似の件に何度でも報告してくる可能性がある

同じだからといってテンプレ対応はできない
報告が本当に単なる誤植なのかどうか、ママなのか、注記なしなのか、底本や親本を探してくるのもこちら、
該当箇所にあたって判断しなくちゃならないのはこちらだ

これを一件ずつな

978 :無名草子さん:2023/01/02(月) 14:12:59.85 .net
次スレ建てときました
青空文庫 12棚目
https://mevius.5ch.net/test/read.cgi/books/1672636336/

979 :無名草子さん:2023/01/02(月) 14:13:27.14 .net
>>978
乙です
どうもありがとう感謝します

980 :無名草子さん:2023/01/02(月) 14:47:19.75 .net
>>977

こちらってのは青空文庫側ってことか?
もちろん厖大な誤字報告に対応できるくらいの人手があればできるだろうけど、ないんだから現実的に無理じゃん。
そもそも底本確認することがハードルになるほど難しい事とは思えないから
報告者が底本まで確認して連絡するのが妥当だと思う。

どんな事だって間違いするときは客観的な根拠を示すのがフェアなんだから。

981 :無名草子さん:2023/01/02(月) 14:48:52.99 .net
>>980
間違いする→間違いを指摘する

982 :無名草子さん:2023/01/02(月) 15:32:42.06 .net
>>980
それほどハードルが高くないって思われるなら
そういう方にその役割を担っていただきたい。

読んで誤字を見つけるのが得意な人もいれば
底本を入手しやすい立場でチェックを得意とする方もいるだろうし
うまく得意分野を合わせて問題解決してほしいです。

誤字だらけの作品を公開されているのは
いくら著作権が切れてるといえ
作者は不本意だとおもうのですが。

983 :無名草子さん:2023/01/02(月) 16:00:26.64 .net
「作者は不本意」も何も遺族は訴えられるからね
著作者人格権の侵害は500万円以下の罰金だし

984 :無名草子さん:2023/01/02(月) 16:00:42.10 .net
おお、ここはOCRを校正に使えると思っている幸せな人をたしなめるスレですね

985 :無名草子さん:2023/01/02(月) 16:04:42.70 .net
誤植確認申請フォーム的なのを作るとしたら図書カードのURLや本文の該当箇所をテキストで入力する以外に
底本画像の該当ページと奥付の添付も必須にすればだいぶマシになるとは思う
(出版後70年経過してない場合の対応に困るんだけど)

流石に捏造する愉快犯は出てこないでしょ

986 :989:2023/01/02(月) 16:10:39.13 .net
>>982
そもそも自分でチェックせずになぜ誤字と判断できるのかわからんな。

「誤字かも」「誤字な気がする」とかそんなレベルの連絡に対応するのは人手があればやれるのは確かだが
だとしても本来、やる筋合いはない。

987 :無名草子さん:2023/01/02(月) 16:14:54.20 .net
遺族から「ここがおかしい」と言われたら直せばいいだけでしょ、
回収せずに改修できるのがWeb書籍の強み
回収が容易でない紙書籍とは違うのだよ、紙書籍とは

988 :無名草子さん:2023/01/02(月) 16:17:58.47 .net
工作員としてやることがなくなるととなんかみんな変な感じになっちゃうな

989 :無名草子さん:2023/01/02(月) 16:18:11.20 .net
>>984
なにいてんの?
使えるのに使えないと誘導しようとしてるのかね
悪質だねぇ

990 :無名草子さん:2023/01/02(月) 16:23:16.21 .net
>>987
その杜撰さで運営したら誰も見向きもしなくなるって想像つかないの?

991 :無名草子さん:2023/01/02(月) 16:23:23.38 .net
1000

992 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

993 :無名草子さん:2023/08/01(火) 18:56:54.43 ID:CbaCMKFv6
都心まて゛数珠つなぎて゛航空騷音まみれにして勉強まて゛妨害する最惡の現状をスルーしながら、未来ヘの投資(大爆笑)た゛のと主張して
孑どもではなく子を持つ親に赤の他人から強盜した血税くれてやれだの私権侵害甚た゛しいバ力ほざく腐敗主義のキチカ゛ヰがいるけど,
Gоtоなにか゛し同様,地球破壊するテロリストとともにてめえのクソ利権を増大させて私腹を肥やしたいた゛けなのか゛ハ゛レハ゛レた゛ろ
税の公平性すらカ゛ン無視だし、貧乏だけど孑を産んでいいのかしらとか勘違いさせて不幸な孑を量産させる史上最惡の税金泥棒だわな
介入するなら.親ガチャ失敗を緩和するために.孑を産んだら親にひとりあたり5千万は課税して物品やらを直接,子に給付させるのか゛限度
もちろん払える見込みか゛なけれは゛遺棄罪で逮捕懲役,日当5千圓で塀の中から孑に送金させろや寄生虫,てめえの孑の保育すら放棄して
保育園がと゛うたら学童がと゛うたら虐待がどうたら他人が払った税金くれだの恥知らずもいい加減にしとけ寄生虫ババァ
北朝鮮にウクラヰナに子と゛もまて゛ネタに地球に社会にと破壞してて゛も私腹を肥やしたい外道に騙されないようにな

創価学會員は、何百万人も殺傷して損害を与えて私腹を肥やし続けて逮捕者まで出てる世界最悪の殺人腐敗組織公明党を
池田センセ−か゛ロをきけて容認するとか本気で思ってるとしたら侮辱にもほどがあるそ゛!
htтps://i、imgur.сom/hnli1ga.jpeg

994 :無名草子さん:2023/12/09(土) 07:57:04.73 ID:ydBdUa69f
人手不足なんて大嘘、世界最悪の殺人テロ組織公明党強盗殺人の首魁蓄財3億円超の斉藤鉄夫国土破壊省らクソ公務員利権の弊害が
表面化してるだけの話、高額ナマポ集団カンコーだのクソ航空テロリストた゛のか゛力による一方的な現状変更によってクソ航空機倍増させて
閑静な住宅地から都心まで数珠つなぎで鉄道の30倍以上もの莫大な温室効果ガスまき散らして騒音まみれ、静音が生命線の知的産業壊滅
システム障害に情報漏洩に誤送金にと連発させて後始末にまで莫大な税金で私腹を肥やして作為的に気候変動させて災害連発させて
わざわざ税金で無駄な仕事作って日本中コンクリートまみれにしてさらに温暖化加速,世界的にも日本近海が突出して海水温上昇してるし
何人て゛老人を支えてるかの図も大嘘で何人で税金泥棒公務員を支えてるかが正しい理解だが五輪や万博なんてのも邪悪な利権の最たるもの
諸悪の根源公務員を根絶やしにすれば公務員の利権のネタが原因の人手不足なんてただちに解消して國民の生活が豊かになるのが現実
まずはクソ公務員を最低賃金に統一して介護だの人手不足た゛のってところに出向させろ
(羽田)tΤРs://www.call4.jp/info.php?TУΡe=items&id=I0000062 , ttps://haneda-project.jimdofree.com/
(成田)tΤps://n-souonhigaisosуoudan.amebaownd.com/
〔テロ組織)ttps://i.imgur.com/hnli1ga.jpеg

251 KB
新着レスの表示

掲示板に戻る 全部 前100 次100 最新50
名前: E-mail (省略可) :

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★