2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

自然言語処理スレッド その4

1 :デフォルトの名無しさん:2014/06/03(火) 05:40:00.54 ID:yefNLumx.net
前前スレ 自然言語処理スレッド その2
http://mimizun.com/log/2ch/tech/1173105287/
前スレ 自然言語処理スレッド その3
http://mimizun.com/log/2ch/tech/1235129481/

このスレッドでは、日本語の構文解析、談話理解、情報検索、
文章生成などの技術に関する理論と(おもに)実装を扱います。
あくまでアプリケーションプログラミングの技術的な面に重点をおきたいので、
学術的な話はアリですが、いわゆる人工無能や哲学的AI話、
言語学の話題などは他のスレッドでお願いします。

967 :Maria:2018/09/16(日) 10:07:53.86 ID:bnxHgENN.net
>>5
> 動的に解析する文法を変えたいときは、
> 実行時にパーサジェネレータや
> コンパイラを使わないといけないのか?
言語は「通じる」のが前提なので、既存の言語の
拡張(方言とかネットスラングとか)なのか、
別の体系の言語(英語とかスワヒリ語とか)なのかによって
アプローチは異なると思う。

968 :デフォルトの名無しさん:2018/09/16(日) 10:15:30.84 ID:bnxHgENN.net
>>6
> word2vec
> paragraph vector
どっちも多変量解析で相関係数出して
因子分解するわけだから、
シソーラス作ったり、「関連する論文を探せ」とか
いった用途には向いていると思う。
ただし、出現頻度が高い一般語と、
出現頻度が低い固有名なんかは、
ノイズになるだけなので、どこかで切り捨てを
行う必要があり、そこは機械学習じゃなくて
人間が行なう必要があると思われ。

969 :デフォルトの名無しさん:2018/09/16(日) 10:21:25.65 ID:bnxHgENN.net
>>8
n-gram 法は理屈がシンプルなわりにそこそこ
精度が出るから活字 OCR とかには向いてる。
ただ、「もう少し精度を上げたい」とか言われると
辞書を増やす以外に工夫の余地がないのが弱点。

970 :デフォルトの名無しさん:2018/09/16(日) 10:41:30.32 ID:bnxHgENN.net
>>34
(1) John,fired Dave,because he had too many absesces.(he=dave)
(1) John,fired Dave,because he had too many employees.(he=dave)

は、

(1) John, fired Dave, because he had too many absesces.(he=Dave)
(2) John, fired Dave, because he had too many employees.(he=John)

だろうな。

971 :Maria:2018/09/16(日) 10:44:42.56 ID:bnxHgENN.net
>>36
「は」は「係助詞」ではなく「とりたて詞」。

972 :Maria:2018/09/16(日) 10:53:37.11 ID:bnxHgENN.net
>>49
> 新聞とかのデータからから「名詞+助詞+動詞」の
> 組み合わせをひろってきたいんだけど、
> 構文解析する必要ありますか?
ありませんね。形態素解析で十分です。
「いや、もっと精度を上げたい」とかいうと、
また話はややこしくなりますが。

973 :デフォルトの名無しさん:2018/09/16(日) 10:57:56.86 ID:BKY25fNA.net
>>966
次スレは誰が立ててもいいと思います


>>1
あとスレのテンプレとかに
意見がある人がいたら言って欲しい

>人工無能や哲学的AI話、言語学の話題など
個人的にそれらの話題を外せっていうのは
どうなのかっていう気がする
かなり密接に関連してるし

「あくまで〜」以降は削ってもいいと思う

974 :Maria:2018/09/16(日) 11:05:33.99 ID:bnxHgENN.net
>>54
> もの凄く精度の高い解析
出現頻度に対する精度だったら一万五千語くらいの
辞書で 99% 以上は楽勝。
ただし「語彙に対する精度」とか言いだすと
地名や人名などの固有名が出てくるとアウト。
その場合は辞書を大きくするか、「辞書未登録+推定
品詞情報」の形で出力してOKかそうでないかを
判定する必要がある。
「ごまめ」を「未登録動詞『ごまむ』の命令形」とか
「くわい」を「未登形容詞『くわい』の連体形現在」とか
言われると困る、という話。

975 :デフォルトの名無しさん:2018/09/16(日) 11:32:45.38 ID:bnxHgENN.net
>>250
> 英語の論文読むのが苦痛でたまらない
> はやく翻訳装置つくってくれ
辞書引きだけなら簡単だが、
辞書をどこから持ってくるかが問題。
機械翻訳は、「この英文をどう訳すと
この日本語になるんだ?」みたいなことがある。
科学技術用の機械翻訳システムを使ったら、
“He is a boy.”が「ヘリウムは少年です。」と
訳されたという語り種(ぐさ)があった。

976 :Maria:2018/09/16(日) 15:08:18.91 ID:bnxHgENN.net
>>973
こんな感じでいいのかな?

このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装と それに付帯する技術および理論について
扱いたいと思っています。

アプリケーション・プログラミングの技術的な面に重点をおきたいので、
学術的な話とか 人工無能とか哲学的AI話とか、言語学の話題などの、
“密接に関連していはいるものの、直接には結びつかない”分野については、
なるべく既存の他スレ、あるいは独立スレにおいて、個別に議論して
いただくよう お願いいたします。
(ただし、その関連性や評価に ついての ご意見や質問等を妨げるものでは
ありません)

以下、【前スレ】
(前スレ張ろうとしたら規制喰らっちゃったい)

977 :Maria:2018/09/16(日) 15:13:57.57 ID:bnxHgENN.net
>>976
> アプリケーション・プログラミングの技術的な面に重点をおきたいので、
は、
> アプリケーション・プログラミングの実用的・応用的な技術的側面に
重点をおきたいので、
のほうがいいのかしら。
あとは、
「『自然言語処理スレッド』
(//pc11.5ch.net/test/read.cgi/tech/1011988273/)」
が規制に引っかかるかどうかがキモだわね。

978 :Maria:2018/09/16(日) 15:30:47.96 ID:bnxHgENN.net
>>250
ISAM を使った辞書引きの手法については、
坂井 利之『翻訳するコンピュータ ― 情報革命と語学の壁に挑む』
(講談社ブルーバックス。一九六九年) に載ってます。
具体的な手法については、いま所内で探しているので、ちょっと
待っててねー。Macintosh 用だったら、その昔“rStone-EJ”っていう
アプリがあったんだけどね。
クリップボード経由でのインタフェースと、GUI に関していうと、
Java でも可能なんで、ちょっと面倒臭いけど可能ではあります。
だけど、どうしても辞書のメンテナンスが大変なんですよ。細かい
メンテナンス用のアプリとか作んなきゃなんないし。
なんか、困ってることがあったら言ってくださいねー!
実装のお手伝いくらいなら、できると思うので。

979 :Mb:2018/09/16(日) 15:34:21.87 ID:bnxHgENN.net
>>974
> 「くわい」を「未登形容詞『くわい』の連体形現在」とか
> 言われると困る
ふはははははは、若輩者め。「くわい」は「動詞『咥う』の
連用形現在」という解釈もあるのを忘れたかぁ!

980 :Maria:2018/09/16(日) 17:09:08.48 ID:bnxHgENN.net
「ヤマトめ ―― やりおったかヤマトめぇぇぇぇ!」
「総統がおかしくなられた ……」
(読み筋は、『宇宙戦艦ヤマト』)

… と、いうわけで、所長がおかしくなられたので、
我らが大森総研はワケがわかんないことになってます。

まず、JAI-Parser は、島内 剛一先生の「ローマ字かな変換」を
実行できるようになってます。で、「かな漢字変換」も
実行できます。さらに、旧 JAI-Parser は「二階建て」でして、
両方の処理ができたんですね。だけど、「そんなもん(候補の
確定)は人間がやればいいんじゃー」と、暴れていらっしゃいます。
以下、待て続報。

981 :Maria:2018/09/16(日) 18:03:52.80 ID:bnxHgENN.net
話は変わりますけど、弁護士会のエラいヒトに、
「弁護士の背任罪」について質問したところ、
「そんなことは絶対にありえません!」と
熱弁されていらっしゃいました。
その後、「実際にあったんですけど ……」と
申し上げたら、「『ありえない』というのは、
『ない』という意味ではなく、『あってはならない』
という意味なんですよ」と、なんかしら必死に弁明
していらっしゃいました。
「でも、『絶対に』というのは、『例外なく』という意味ですよね?」
「普通は、そういう意味じゃないんです!」
素数は、「1とそれ自身以外に約数を持たない自然数」のはずですが、
たとえば「6は例外」とかになっちゃうとしたら、自然言語処理って、
けっきょく無力ですよねぇ?
「0は素数」とか「1は素数」とか言われても、「それは例外」だったら、
べつに「256 は例外的に素数」って言われても、納得しなきゃ
いけないわけですから。

982 :Maria:2018/09/16(日) 18:58:42.91 ID:bnxHgENN.net
前にもたびたび話題になりましたけど、「中間言語」とか
「知識表現」とかいったモノは、ひょっとしたら
必要ないんじゃないの?みたいな話があります。
「文語で書いたモノがあれば、それはデータなんであって、
人間がどう解釈するかっていうのは、けっきょく人間の
都合じゃねぇの?」っていう立場です。
「春は、あけぼの」って言われたら、「平安時代に、清少納言と
呼ばれた人が、『春は、あけぼの』と書き残した」という事実が
あるだけで、「じゃあ、本当に平安時代の春はあけぼのだったのか?」
を確認しようはありません。「だったら平安時代に行ってこい」みたいな
話になるわけですし、文献以外に残っているものは、考古学的な
証拠しかないのですから。
現代社会においても、裁判においては調書と物証がすべてなワケだし、
それが捏造されてて冤罪だったりするかもしれません。
そんなワケで、「意味」については、人間に丸投げしちゃって
いいんじゃないでしょうか。

983 :Mb:2018/09/16(日) 19:35:22.85 ID:bnxHgENN.net
だいたい、「1+1は2である」けれど、
「1+1は3にも4にもなる」とか言ってる
人類に、自然言語処理システムなんていう
危なっかしいモノを与えちゃダメなんじゃねぇか?
(筒井康隆さんの『アフリカの爆弾』とか
思い出すなぁ)
「マルクス=レーニン主義こそが真の科学であり、
それ以外の科学は、単なるイデオロギーに過ぎない」
とか真面目に信じてる独裁者がいて、社会を浄化するために
反体制勢力を AI で撲滅するシステムを構築したりしたら、
まるっきりジョージ・オーウェルの『1984』じゃねぇか。

984 :958:2018/09/16(日) 20:22:53.60 ID:BKY25fNA.net
>>976
>アプリケーション・プログラミングの技術的な面に重点をおきたいので〜
いや上以降(原文ではあくまで〜以降)をまるごと削除って意味
テンプレで話題をゴチャゴチャ制限するのって筋悪いと思う

985 :デフォルトの名無しさん:2018/09/16(日) 21:25:42.42 ID:SOVIz+sV.net
やまとは くにのまほろば たたなづく あをかき やまごもれる やまとし うるはし

986 :デフォルトの名無しさん:2018/09/16(日) 21:57:31.23 ID:ltjz3YFA.net
>>983
>「1+1は2である」

コンピューターシステムで一般的な二進法では 1+1は10。

987 :デフォルトの名無しさん:2018/09/17(月) 04:38:41.79 ID:rTQuL7Ni.net
なるほど。それでいいんなら、そっちの方が都合がいいや。
このところ、多少引っかかっていたことがあって、
「文法に関して、もうちょっと足下を固めておいたほうが
いいんじゃないだろうか?」と思いはじめていたので、
「後段は縛りがきついな」と思っていた。
>>986 みたいな話も、考えてみると、けっこう奥が深いし。

988 :Mr.Moto:2018/09/17(月) 05:01:57.05 ID:rTQuL7Ni.net
>>987
そもそもは、たまたま「ローマ字かな変換とかな漢字変換の
両方が、双方向で簡単にできる」というシステムを作っちゃった
のが発端なんだ。“sinai” が「市内」なのか「竹刀」なのか「親愛」
なのか「sin(ai)」の判別を、構文解析・意味解析・意味解析の
レベルまで保留しておこうとか、ずっと考えてたんだよね。
あるいは「ふたえにまげてくびにかけるじゅず」が「二重に曲げ
手首にかける数珠」なのか「二重に曲げて首にかける数珠」なのか。
「ここではきものをぬいでください」が「ここでは着物を脱いでください」
なのか「ここで履物を脱いでください」なのか。
あるいは、読みを「開く/閉じる」の問題。「話」は名詞だけど「話し」
と書くと動詞の連用形現在になるので、ニュアンスが変わっちゃうとか、
「持ち帰り」か「持帰り」か「持ちかえり」かとか、「書留」は「書留め」
でも「書き留め」でもないけど「書きとめる」は「書き止める」と
書くと「書きとどめる」になるとか、「出だし」は「出出し」と書かないとか、
「とにかく」か「兎に角」かとか「ください」か「下さい」かとか、
そういう「実用的な部分で引っかかるところ」というものに対して、
昨今の自然言語処理の研究者って向かい合ってないように思うんだよ。
「それは文法や文学の問題であって、科学技術の観点からいうと
些末な問題でしかない」と。このスレでも、文法に対する忌避反応と
いうのがあるだろう? だけど、「実用」「応用」を考えると、
それは切り捨てちゃいけないことだと思うんだけどね。

989 :Maria:2018/09/17(月) 05:21:59.22 ID:rTQuL7Ni.net
>>985
一九五九年に電気試験所で作られた翻訳機械の名前が「やまと」。

990 :デフォルトの名無しさん:2018/09/17(月) 05:35:32.59 ID:rTQuL7Ni.net
>>986
現代数学的な構成主義によれば、
「2+2=4」。
「1の “次の数” 」として2が定義され、
それを前提として加法が定義される。
この時点で「2+2=4」が導入され、
そこからさらに定義を延長することで、
「1+1=2」が帰結され、加法の
逆操作として減算を考えることで
負数を含めた整数が定義される。
これとは別に、加法のくり返しとしての
乗算が定義されるんだが、乗法の逆演算としての
除法を考えると「0」の扱いがややこしいことになり、
インドでは0が「悪魔の数字」と呼ばれることになる。

このあたりを掌握できる自然言語処理システムとか
考えだすと、あんまり実装っぽい話にならんで
AI 哲学みたいな話になっちゃうんだよなぁ。

991 :デフォルトの名無しさん:2018/09/17(月) 07:13:46.68 ID:C7pw6n1T.net
>>386
>25000×25000=626000000通りの「共起関係」、
>及び29種類の「属性」を、人力で分析してアノテーションコーパスを作成すべき!

『頻出』と『例外』を検出しておきたい。

992 :デフォルトの名無しさん:2018/09/17(月) 07:24:42.74 ID:C7pw6n1T.net
自然言語処理の知識はゼロなのでわからないです。面白いアイデアだと思うので、Twitterの自然言語処理が専門の方々に聞いてみては?
https://peing.net/ja/q/417c9e29-35de-4c95-8323-afd6a50fcbc7

コンピューターのための自然言語理解シミュレ
ーターというのは可能ですか?

例えば第二次大戦の推移について、言葉ではな
くて動画で理解する方法もあります。
言葉で説明するよりもマインクラフトのような
創作ゲーム表現に変えたほうが分かりやすいで
す。
けれども自分が読み漁った人工知能や自然言語
処理の本にはそうしたアプローチは見つからな
かったです。
言語はただの記号の羅列で機械は現実世界を全
く知らない。でもそういうことなら、
テレビゲームのような仮想世界をインプットし
て、自然言語で操作したらいいと思います。
というか自然言語入力でときめきメモリアルみ
たいなゲームをやってみたいてす。

993 :デフォルトの名無しさん:2018/09/17(月) 07:27:25.16 ID:C7pw6n1T.net
教育重視のシナリオの場合は、AI の脳が正しく正確なデータに基づいて学習することを確実にしつつも、
技術の成功と安全性のために はセンサー情報が不可欠です。AirSim を AI 実験、ディープ ラーニング、
強化学習用のためのツールとして改変させ続けることが、本研究プ ロジェクトにおける Microsoft の狙いです。
人工知能がエキサイティングに進化する時代に突入しました。ツールと技術が一 般化して不可能なことも
すぐに可能となるでしょう。アンリアル エンジンを使って多種多様な設計およびリサーチ業界全体で
AI 開発と教育 アプローチを可能にすることで、次世代の人工知能の進化において解き放たれる潜在的な進歩の
大きなレベルがあります。次世代に向けて人工 知能はとてつもなく大きな進歩が期待できます。

2018.4.13
バーチャル シミュレーションを活用してアンリアル エンジンで AI を教育する
https://www.unrealengine.com/ja/blog/ai-in-unreal-engine-learning-through-virtual-simulations

994 :デフォルトの名無しさん:2018/09/17(月) 07:50:14.66 ID:C7pw6n1T.net
>>955
>コンピュータに「常識」を持たせてあげないと、
>「〇と×のいずれかを」を「〇 xor × のいずれか一方を」
>と解釈してくれなくて、

コンピューターに『人間の常識』を教えるには、一つ一つ丹念にインプットするかシミュレーションしかない。
『AとBのいずれか』『AとBの両方』は、頻出概念として予め人力で登録しておく。

995 :デフォルトの名無しさん:2018/09/17(月) 07:55:05.14 ID:C7pw6n1T.net
>>474
>【数学の大学入試問題、被りすぎやろ(2017年入試)】

入試数学はパターンが非常に限られているので、丹念に人力インプットするだけでもいい。
2016年の東ロボのような時代遅れの統計的機械翻訳でも偏差値76.2を記録しまのだから。

996 :デフォルトの名無しさん:2018/09/17(月) 07:58:55.56 ID:C7pw6n1T.net
>>981
>「でも、『絶対に』というのは、『例外なく』という意味ですよね?」

例外は例外として、人力でインプットするしかないと思う。

997 :デフォルトの名無しさん:2018/09/17(月) 08:08:16.13 ID:C7pw6n1T.net
国民的番組の笑いを生んだ『8時だョ!全員集合』の舞台セットデザイン
https://wired.jp/2017/02/25/the-drifters/#galleryimage_259267-1493_1

言語理解シミュレーションのための舞台セットも用意しておきたい!

998 :デフォルトの名無しさん:2018/09/17(月) 08:22:21.34 ID:rTQuL7Ni.net
新スレを立てようと思ったら、なんかのNGワードで
引っかかってんだが、どこで引っかかってんのか判らん。
(自然言語処理をやってる人間がなんてざまだ (-_-!))
とりあえず誰か

自然言語処理スレッド その5
このスレッドでは、おもに日本語の構文解析・談話理解・情報検索・
文章生成などの、実装とそれに付帯する技術および理論について
扱いたいと思っています。

で立てといてくれ。

999 :デフォルトの名無しさん:2018/09/17(月) 08:38:07.68 ID:C7pw6n1T.net
>>982
>人間がどう解釈するかっていうのは、けっきょく人間の都合じゃねぇの?

『1秒ごとに』という日本語もねーーーwww

y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルずつ速度が上がる』というのは数学を持ち出すまで
もなく物理的におかしいでしょう。そんな奇妙な加速をしながら落下する玉を私は見たことがありません。
この本は中高生向けの本なのですが、読解力のある中高生はこの文章を読むと間違った知識を手に入れることになります。
なんとなく『1秒ごとに秒速9.8メートルずつ速度が上がる玉』が、どのような動きなのか気になったので
以下にプログラムを書いてみました。新井紀子教授の世界(Norico’s World)を私たちの世界
(Our World)と合わせてご覧ください。
https://mywarstory.tokyo/nerd-sanctuary/

1000 :デフォルトの名無しさん:2018/09/17(月) 08:50:41.35 ID:rTQuL7Ni.net
>>992
古典的なところでは、積木の世界をターゲットにした
SHRDLUがある。とはいえ、自然言語処理が
人工知能のサブジャンルであるとしても、
自動車の自動運転技術とかが別にあるので
別々に開発して統合するというのも
ひとつの方法だと思う。

ゲームとしての面白さを追求するなら、
人工知能を搭載した軍艦と戦車と航空隊を
日本語で統制するとかいったシミュレーション・
ウォーゲームとかがいいんじゃないだろうか?
「アンノウンは警告に応答しない。依然高度を
下げつつ南下中。火器使用の許可を願う。送れ」
「火器の使用を許可する。送れ」
みたいなのはイケると思う。
「ばかもん。俺のケツを舐めろ」とか、
ぜってー誰かやりそうだが。

1001 :デフォルトの名無しさん:2018/09/17(月) 09:08:02.28 ID:rTQuL7Ni.net
>>999
> y=9.8x(m/秒)の解釈が『1秒ごとに秒速9.8メートルづつ
> 速度が上がる』という
物理を齧った奴だったら、「v=gt (SI 単位系。g ≒ 9.80665 m/sec^2)」
と書いてほしいだろうし、一目見て「真空中の自由落下だろうけど、
どのくらいの規模と精度を考えてるんだろうか?」と考えるだろう。
コンピュータに物理学や力学のセンスを持たせるためにも、
「われわれ人間にとっての “自明性” の正体ってなんだろう?」という
点について掘り下げる必要があると思う。おれなんかは高機能自閉だから、
そういう意味では人生のうちの多くを「自分の行動を妨げる壁」としての
「自明性との闘い」に費やしているので、自然言語処理の研究者に
向いてるっちゃあ向いてると思っているが。

1002 :デフォルトの名無しさん:2018/09/17(月) 09:47:54.36 ID:Ep0iz6P/.net
>>1001
>そういう意味では人生のうちの多くを「自分の行動を妨げる壁」としての
>「自明性との闘い」に費やしているので、自然言語処理の研究者に
>向いてるっちゃあ向いてると思っているが。

けれども学会のお偉方というのは、僕らのような無名人の相手は殆どしない。

>>734
>それが学会で評価されると信じるのは、「いつか王子様が」
>みたいなファンタジーでしかない。

死期になったら辞世の句を添えて自費出版、評価されるのは死後でいい。

1003 :Mr.Moto:2018/09/17(月) 11:51:32.81 ID:rTQuL7Ni.net
次スレ
『自然言語処理スレッド その5』
(ttps://mevius.5ch.net/test/read.cgi/tech/1537152490/)

>>998
「立った! クララが立った!」

1004 :Mr.Moto:2018/09/17(月) 12:02:40.21 ID:rTQuL7Ni.net
>>1002
そういえば、自然言語処理と(形態素解析レベルの)国文法の
両方の話ができる学会って、どっかにあるんだろうか。
自然言語処理関係の学会で国文法関連の話をすると、あからさまに
厭な顔をされる。
さりとて国文法関連の学会で自然言語処理関連の話をすると、
みなさん逃げ腰になる。

かといって、現代国語の文法を教えている中学校の教諭や、
文語文法を教えている高校の教諭は、「文法」と聞いただけで
面相と顔色が変わるので、教育関係(国語強意kとコンピュータ・
リテラシーとか)関連の学会からも歓迎されないらしい。

だれか、「こういう集まりがあるぞ?」という心当たりのある
方はいらっしゃらないか?

まぁ、おれみたいな強面のおっさんと顔を合わせたくない奴は
多いだろうが、Maria もいるこったし、「お前は出てくんな」と
言われたら、なるべく出てこないようにするが、どうか。

1005 :Mr.Moto:2018/09/17(月) 12:10:13.61 ID:rTQuL7Ni.net
>>1004
『言語処理学会』
http://www.anlp.jp/)って、
ぶっちゃけ どんな雰囲気なの?
だれか関係してる人っている?

1006 :Maria:2018/09/17(月) 12:19:11.59 ID:rTQuL7Ni.net
つーか、『自然言語処理学会』っていうのがあるらしいんだけど、
『言語処理学会』と URL が一緒なのよね。
で、国語学に関しては、『計量国語学会』
(ttp://www.math-ling.org/)っていうのがあるらしいんだけど、
どんな雰囲気なの? だれか知ってる人っている?

1007 :デフォルトの名無しさん:2018/09/17(月) 12:22:43.11 ID:rTQuL7Ni.net
>>1002
> 死期になったら辞世の句を添えて自費出版、評価されるのは死後でいい。
おれが死ぬまで待ってたら、おれが死ぬまで待ってなきゃいけない
奴が出るだろうがよ。
おれも目の黒いうちに成果を見届けたいし、
視覚障害者・聴覚障害者の方々は、
一刻も早く対処してほしいと思ってるんだよ。
だろ?

1008 :デフォルトの名無しさん:2018/09/17(月) 12:36:42.80 ID:rTQuL7Ni.net
>>1002
> けれども学会のお偉方というのは、僕らのような
> 無名人の相手は殆どしない。
意外にそうでもない(まぁ、創価学会とかだと別かもしれんが)。
日本ソフトウェア科学会の総会に出たら、委任状が集まんなくて
「総会が成立しない」というので大騒動になったことがあって、
隣でニヤニヤしながら懇親会用のビールを飲んでいるオッサンが
いたので、よく見たら渕 一博先生だったことがある。
「ロジック・プログラミング・コンファレンス」の大会に行ったら、
隣で「痛たたたたた」と苦しんでいるジイサンがいたので、「大丈夫ですか?」
と訊いたら、「いや、今年の大雪で、大学の敷地内で転んで大腿骨を骨折
しまして」とおっしゃるので「元気なジジイだな」と思いつつも「何かあったら
おっしゃってくださいね」と言ったら、「私、こういう者です」という名刺を出されて
見たら一松 信先生 m(_ _)m
本当に偉いジジババは、生い先短いから、面白いネタに貪欲なんだと思う。
「ザコに構ってる暇がない」んであって、本当に面白いネタを持ってくか
どうかだと思う。

1009 :デフォルトの名無しさん:2018/09/17(月) 12:40:14.13 ID:rTQuL7Ni.net
>>996
> 例外は例外として、人力でインプットするしかないと思う。
例外を認めたら論理が破綻するので、
「人力でインプットする」ことを認めちゃダメだと思う。

1010 :デフォルトの名無しさん:2018/09/17(月) 14:13:45.42 ID:rTQuL7Ni.net
>>959
> 「人力でインプットする」ことを認めちゃダメだと思う。
つーか、「入力」と「インプット」は同義語なんで、
本来は「人力でインプットする」は冗語なのだ、と思う。

とはいえ、「情報」と「データ」の違いについて
理解していない人が多いので、「通じない言語は
言語としての意味があるのか?」という疑問を
感じた。

1011 :デフォルトの名無しさん:2018/09/17(月) 14:39:38.35 ID:rTQuL7Ni.net
>>991
共起関係つーか連接関係については
某企業で科研費を貰っているというので
成果を上げないとヤヴァイ、というので
尻拭いで やったことがあるが、
担当者が相関表を読めなかったので
「ここに相関が出てるじゃねぇか (w」と
指摘したら取締役兼部長に嫌われて
首馘(くび)になった。

別の会社で、「論文どうしの相関に基いて、
類似した論文を検索したい」という要求が
(特に名を秘す、某)日本産婦人学会(仮名。
実在する学会等とは関係ありません)と
(特に名を秘す、某)日本脊椎脊髄病学会(仮名。
実在する学会等とは関係ありません)
から「なんとかならんか?」という話があって、
「共起関係に基づく相関について分析すると、
ありもののツールで構築すれば なんとかなりますけど、
シソーラスとか いろいろ作らなきゃいけないので、実工数
ベースで三百万円、エンドユーザを対象に一からアプリケーション
を作るのを商売でやるんだったら、千五百万円くらい貰わないと、
こっちがペイしません」と正直に答えた。

そうしたら、お客さんが「他所でも同じことを言われたが、
向こうは五千万と言ってた」と、ボソッと言ってたという。

その後の経緯については、おれは馘首になったので知らない。

1012 :デフォルトの名無しさん:2018/09/17(月) 14:49:32.06 ID:rTQuL7Ni.net
>>981
> 「立った! クララが立った!」
どこかの動物園で、コビトカバの雌が生まれたので、
名前を公募したところ、ダントツ(「断然トップ」の略)で
「クララ」と命名されたという話がある。

そんなわけで、日本と日本語は、とうぶん大丈夫だと思っている。

「クララのカバッ!」
読み筋は、『アルプスの少女ハイジ』。

1013 :Maria:2018/09/17(月) 15:10:53.47 ID:rTQuL7Ni.net
>>292
> (x,y,z)=(主語,述語,目的語)で、出現頻度の多い順に並べる、
> あるいは少ない順に並べる。高頻度のトリプルがやたら多いと
> いうことは、
> 逆に言えば他と似たり寄ったりでつまらないコンテンツである
> 可能性が高い。出現頻度の少ない組み合わせは、オリジナル表現か
> あるいはナンセンス文かのどちらか。
に関してコメントしておくと、これは
(v, s, o, c) =(述語、主格、目的格, 与格)
くらいにしておくのが順当だと思われます。
述語がないと文にならないし、
「れる・られる」が入ってくると、主語と目的語の
交替が起きたりします。
方向格とか到達格とかいうのが あるのか、という問題は
あると思うんですけど、とりあえず、「なくても困らないんじゃないか」
という意見はあります。

1014 :デフォルトの名無しさん:2018/09/17(月) 17:04:14.73 ID:rTQuL7Ni.net
『言語処理学会』とか『計量国語学会』とか、
入会したほうがいいのかなぁ。
いちおう論文のネタになるような話は
いくつかあるんだが。

1015 :Maria:2018/09/17(月) 17:10:32.28 ID:rTQuL7Ni.net
「四段活用 h 行音末尾動詞」は、
h 音の消失によって a/o/u 音が指標になったとか、
形態素解析は(本来は構文解析の手法として知られている)
チャート法で、かなりの精度で行えるとか、
五段活用 n 行音末尾動詞は、「死ぬ」「去(い)ぬ」
以外に見当たらないとか、
「来る」「する」以外に、「言う」「行く」および
「乞う/請う」「問う」という不規則活用動詞(変格
活用動詞)があるとか、いろいろあるんですけどね?

1016 :2ch.net投稿限界:Over 1000 Thread
2ch.netからのレス数が1000に到達しました。

総レス数 1016
452 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★