2ちゃんねる ■掲示板に戻る■ 全部 1- 最新50    

■ このスレッドは過去ログ倉庫に格納されています

音声合成プログラムを作りる

1 :デフォルトの名無しさん:2007/06/14(木) 09:48:48 .net
ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ



2 :デフォルトの名無しさん:2007/06/14(木) 09:52:04 .net
じゃあ、一緒に作るれ

3 :デフォルトの名無しさん:2007/06/14(木) 09:54:14 .net
しゃべた

4 :デフォルトの名無しさん:2007/06/14(木) 10:08:17 .net
ネトラジリソース多いのんって誰かな
BGMとかあんまなくって、高音質なの


5 :デフォルトの名無しさん:2007/06/14(木) 10:33:17 .net
よし、みんなで作れろ

6 :デフォルトの名無しさん:2007/06/14(木) 12:27:51 .net
中原小麦が多いるれ

7 :デフォルトの名無しさん:2007/06/14(木) 14:18:18 .net
音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。

8 :デフォルトの名無しさん:2007/06/14(木) 14:39:22 .net
音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。

9 :7:2007/06/14(木) 14:57:22 .net
シミュレーションやるより、模型?を作った方が楽なんだなー

10 :デフォルトの名無しさん:2007/06/14(木) 14:58:35 .net
でも、模型はメンテナンスが

11 :デフォルトの名無しさん:2007/06/14(木) 16:22:28 .net
>>7 に期待

12 :7:2007/06/14(木) 20:44:39 .net
いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ?
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。

13 :デフォルトの名無しさん:2007/06/14(木) 21:11:40 .net
       |
   \  __  /
   _ (m) _ピコーン
      |ミ|
    /  `´  \
     ('A`)     そうだ! 自分で喋ればいいんだ!
     ノヽノヽ
       くく

14 :デフォルトの名無しさん:2007/06/15(金) 00:03:29 .net
>>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。

15 :1:2007/06/15(金) 01:58:54 .net
まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな


16 :7:2007/06/15(金) 02:42:52 .net
ツールならHTKにいいのがあるんじゃね?

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな?
しかし懐かしすぎ・・・

17 :1:2007/06/15(金) 02:48:21 .net
>>16
HTKおk、しらべる
thx

18 :デフォルトの名無しさん:2007/06/15(金) 16:35:47 .net


19 :デフォルトの名無しさん:2007/06/16(土) 16:15:14 .net
1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる

20 :1:2007/06/17(日) 14:53:48 .net
HTK登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声db作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの?
0から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな


21 :デフォルトの名無しさん:2007/06/19(火) 02:06:23 .net
http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ!

22 :1:2007/06/20(水) 03:00:36 .net
86時間て正味?ネトラジから集めよう思たら数年分必要だなー
ところでこれNHKの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん?


23 :デフォルトの名無しさん:2007/07/08(日) 20:38:20 .net
http://pc11.2ch.net/test/read.cgi/software/1119069271/

24 :デフォルトの名無しさん:2007/07/10(火) 17:10:43 .net
理系大学院って工学部と理学部でだいぶ違うよな

25 :1:2007/07/10(火) 23:29:09 .net
>>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな


26 :デフォルトの名無しさん:2007/07/13(金) 14:22:49 .net
age

27 :デフォルトの名無しさん:2007/07/13(金) 14:27:35 .net
age

28 :デフォルトの名無しさん:2007/07/13(金) 14:29:44 .net
age

29 :デフォルトの名無しさん:2007/07/13(金) 14:40:43 .net
ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php

30 :デフォルトの名無しさん:2007/07/13(金) 18:29:39 .net
同じ金額で声優雇った方が早くね?

31 :1:2007/07/14(土) 00:03:56 .net
>>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で2ちゃんログとかメールとか
読んでもらったら面白くなくね?


32 :デフォルトの名無しさん:2007/07/19(木) 21:26:09 .net
音(声)の切り張りと云うと、コナミがときメモ3でやってなかったっけ?
未プレイ(体験版触っただけ)だから、詳しくは解らんけど。

33 :名無しさん@そうだ選挙に行こう:2007/07/29(日) 04:01:34 .net
イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。


34 :1:2007/07/30(月) 00:14:46 .net
>>32
ときめも2と3でプレーヤの名前を呼んでくれる
EVSという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html


35 :1:2007/07/30(月) 00:22:44 .net
"音声合成 ゲーム"で検索すると
PS2 モジブリボンにNTT
PS2 ダビつく3に東芝
DS お料理ナビは?
DS 日本史・世界史に日立
なんてのが見つかったよ
どうなん?

36 :1:2007/07/30(月) 00:26:22 .net
>>33
イントネーションって網羅できるもんなの?
AquesTalkってあんまりきれいな声とは思えない


37 :デフォルトの名無しさん:2007/07/31(火) 01:27:57 .net
以前でてた音声コーパスっていうのがそういうものじゃないのか?

38 :デフォルトの名無しさん:2007/07/31(火) 04:55:00 .net
同じ単語でもどう使われるかでイントネーションって変わるからな。

39 :デフォルトの名無しさん:2007/08/01(水) 00:48:55 .net
>>38
例えば?

40 :デフォルトの名無しさん:2007/08/06(月) 10:44:13 .net
彼氏↑、彼氏↓

41 :デフォルトの名無しさん:2007/08/06(月) 16:39:36 .net
箸 端 橋 嘴 波子 梯
頑張って聞き分けてください。

42 :デフォルトの名無しさん:2007/08/06(月) 17:10:09 .net
無理ッス絶対無理ッス自分無理ッス

43 :デフォルトの名無しさん:2007/08/06(月) 20:17:36 .net
>>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。

44 :デフォルトの名無しさん:2007/08/06(月) 20:32:17 .net
どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw

45 :デフォルトの名無しさん:2007/08/06(月) 20:33:20 .net
>>35
くまうたも忘れないでくれ

46 :デフォルトの名無しさん:2007/08/08(水) 01:18:40 .net
早く作りろ

47 :デフォルトの名無しさん:2007/08/08(水) 01:58:32 .net
「あ」の波形と「い」の波形を足して2で割ったら、「あ」と「い」の中間の声ができるってわけか!

48 :デフォルトの名無しさん:2007/08/08(水) 01:59:27 .net
ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン

49 :デフォルトの名無しさん:2007/08/08(水) 02:11:22 .net
じゃ期限は明日の0時だ。よろしく。

50 :デフォルトの名無しさん:2007/08/08(水) 04:15:54 .net
オーケーベイビー
首洗って待ってな。

51 :デフォルトの名無しさん:2007/08/09(木) 01:17:32 .net
まだぁー?
もう全身洗って待ってるんだけど。

52 :デフォルトの名無しさん:2007/08/09(木) 06:52:26 .net
声帯って振動するだけ?声によって(高さじゃなく「あ」とか「い」)振動の仕方が異なることはないよね?
音が高くなると振動数が増えるだけだよね?
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの?
舌のシミュレーションが大変そう(><;)

53 :デフォルトの名無しさん:2007/08/09(木) 10:39:18 .net
音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。

54 :デフォルトの名無しさん:2007/08/10(金) 14:06:39 .net
必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ

55 :1:2007/08/10(金) 16:14:15 .net
>>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ

56 :デフォルトの名無しさん:2007/08/11(土) 18:40:21 .net
どっちかっつーと話者変換のほうに興味があるんだが

57 :デフォルトの名無しさん:2007/08/16(木) 22:59:34 .net
その声優の音声ファイルはSNいいのか?


58 :1:2007/08/16(木) 23:48:39 .net
>>56
話者変換って何に使うん?
自分のしゃべった声を誰かの声に似せるとかな?


59 :1:2007/08/17(金) 00:13:19 .net
>>57
SNは分かんねが、音は良さげ(64kbpsの44kHz)
一人しゃべりでBGMなしなんじょ


60 :デフォルトの名無しさん:2007/08/17(金) 01:07:05 .net
BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。

61 :デフォルトの名無しさん:2007/08/17(金) 20:59:04 .net
俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい

62 :デフォルトの名無しさん:2007/08/24(金) 21:36:59 .net
エロゲの音声使えば?
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ

63 :デフォルトの名無しさん:2007/08/28(火) 07:41:37 .net
北都さんの声でお願いします

64 :デフォルトの名無しさん:2007/09/06(木) 14:16:39 .net
結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF

65 :デフォルトの名無しさん:2007/09/06(木) 20:14:37 .net
>>64
藤田咲はまなストのモモ役が良かったなぁ

66 :デフォルトの名無しさん:2007/09/21(金) 10:48:08 .net
ときめも2以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて

67 :デフォルトの名無しさん:2007/12/17(月) 22:51:47 .net
>>66
overlap add

68 :デフォルトの名無しさん:2007/12/19(水) 12:23:36 .net
――
学校

 ̄ ̄ ̄\
専門学校

69 :デフォルトの名無しさん:2007/12/20(木) 23:14:24 .net
>>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい

70 :デフォルトの名無しさん:2007/12/21(金) 01:38:07 .net
Alice Project

71 :デフォルトの名無しさん:2007/12/24(月) 09:25:18 .net
2007/12/19(Wed.) ◆ Julius-4.0 リリース


72 :デフォルトの名無しさん:2007/12/29(土) 18:28:29 .net
初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。

そんな、俺に、お勧めはこれ。

「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1

73 :デフォルトの名無しさん:2007/12/30(日) 12:03:36 .net
音声合成というより、台詞合成だな

74 :デフォルトの名無しさん:2007/12/30(日) 13:55:26 .net
>>72
ワロタ

75 :デフォルトの名無しさん:2008/01/06(日) 13:05:04 .net
れこーどうえーぶ
http://recwav.dip.jp/

音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222

76 :デフォルトの名無しさん:2008/01/10(木) 21:52:09 .net
この板の住人じゃないんだけどAquesTalkでwav保存できるソフト
あるのかな?
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしw

77 :デフォルトの名無しさん:2008/01/11(金) 06:44:14 .net
全二十じゃないの?

78 :デフォルトの名無しさん:2008/01/11(金) 13:26:54 .net
全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば?ということかな?
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。


79 :デフォルトの名無しさん:2008/01/13(日) 09:32:40 .net
普通に、ライン出力を録画するんではダメなのか?

80 :デフォルトの名無しさん:2008/01/18(金) 02:45:43 .net
>>78
スマンスマンw
二十って書いたの俺かもw

81 :デフォルトの名無しさん:2008/01/19(土) 00:36:30 .net
>>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか?
ほとんどの人がライセンスがないから試せないと思われ。

82 :デフォルトの名無しさん:2008/01/26(土) 02:02:50 .net
>>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない

83 :デフォルトの名無しさん:2008/01/26(土) 02:53:10 .net
全二重に温室関係案のカナ?

84 :デフォルトの名無しさん:2008/02/07(木) 12:56:18 .net
いまどこまで進んでいるんだ?

85 :デフォルトの名無しさん:2008/03/24(月) 13:24:15 .net
age


86 :デフォルトの名無しさん:2008/04/06(日) 12:19:17 .net
>>1
おーい!いまどこまで進んでいるんだ?

87 :デフォルトの名無しさん:2008/04/07(月) 01:29:34 .net
age

88 :デフォルトの名無しさん:2008/04/07(月) 04:01:19 .net
「あ」の波形と「う」の波形を足して2で割ったら「い」の波形ができるのを発見して特許取った

89 :デフォルトの名無しさん:2008/04/07(月) 08:54:58 .net
特許番号は?

90 :デフォルトの名無しさん:2008/04/07(月) 21:51:13 .net
どのくらい 「い」 と区別が付かないんだ?
不自然感0?

91 :デフォルトの名無しさん:2008/04/07(月) 21:54:23 .net
じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん

92 :デフォルトの名無しさん:2008/04/23(水) 18:22:12 .net
>>88-91
もうちょっとでアヘ声が実現するな

93 :デフォルトの名無しさん:2008/04/29(火) 23:32:40 .net
>>88 特許番号は?

94 :デフォルトの名無しさん:2008/05/01(木) 14:02:57 .net
juliusで音素列を指定して、
強制アライメント取れますか?

95 :デフォルトの名無しさん:2008/05/02(金) 23:24:08 .net
>>94
つ 単語・音素セグメンテーションキット&Julian


96 :94:2008/05/07(水) 03:45:12 .net
>>95
ありがと
juliusでディクテーションさせて、julianで強制アライメントできるようになりました。
ところで、ピッチを求めるいいアルゴリズムはありませんか?


97 :デフォルトの名無しさん:2008/05/14(水) 13:20:18 .net
C++MIDIプログラミングっていう廃刊を店に売ろうか悩んでるんだけどいくらになるんだろう

98 :デフォルトの名無しさん:2008/05/17(土) 07:29:42 .net
ヤフオクの方が売れるんじゃね?

99 :94:2008/05/19(月) 00:47:59 .net
とりあえず、声優のラジオ番組の音声分割して、接続合成できるプログラム作ってみました
juliusの認識精度ではダメですね、手修正必須ですが

100 :デフォルトの名無しさん:2008/05/19(月) 08:53:12 .net
そうか
音声素材なんてわざわざ録音しないでも
ネットラジオにいくらでも転がってるんだな
面白い発想するな

101 :デフォルトの名無しさん:2008/05/19(月) 22:39:48 .net
これは意外な盲点。
個人(?)で使う分には十分だね。

102 :デフォルトの名無しさん:2008/05/20(火) 12:01:59 .net
>>99
サンプルを聞いてみたいです

103 :デフォルトの名無しさん:2008/05/20(火) 19:25:05 .net
周波数と最初に名づけたやつは死んでいいと思うな

104 :94:2008/05/24(土) 11:02:31 .net
>>102
音ってどこにアップできます?
それと何話させましょ?
声優はSMです

105 :102:2008/05/24(土) 13:14:10 .net
>>104
アップローダは↓でお願いします。
ttp://www.axfc.net/uploader/

セリフは↓のサンプル音声の「シナリオ」あたりでどうでしょう。
ttp://voice.pentax.jp/blog/64.html


106 :デフォルトの名無しさん:2008/05/24(土) 15:20:08 .net
ttp://www.aoni.co.jp/actress/ma/voice/minaguchi-yuko.mp3
これで

107 :94:2008/05/25(日) 10:00:48 .net
>>105,106
ttp://www11.axfc.net/uploader/20/so/He_103620.lzh
kwdは94です


108 :102:2008/05/25(日) 11:08:17 .net
>>107
サンプル拝聴しました。
音素や単音単位ではなく、単語単位の連結なんですね。
語のつながりがぶつ切りで、聞き取るにはちょっと辛いかなと思います。
音素単位なら、聞き取りやすくなるかもしれませんが、
抑揚やアクセントを指定できるようにしないといけないので、難しいですが。

109 :94:2008/05/25(日) 22:57:56 .net
>>108
アドバイスありがとうございます。
使えるだけ使うので、単語より長い部分も1音素だけの部分もあります。
今はピッチ情報がないので抑揚をそろえられないです。だから最長一致。
これからはピッチをそろえられるようにしてみます。


110 :デフォルトの名無しさん:2008/07/12(土) 13:27:35 .net
>>109
これってオープンソースにしないの?


111 :デフォルトの名無しさん:2008/07/13(日) 13:49:42 .net
>>109
94さん

>>110の追加なんですがオープンソース化のメリットは・・・

開発が止まっても後を継げる。

・例えば作者が飽きたとか、あるいは交通事故にあったとかで開発が止まったとする。
 そんな場合、誰かが開発を引き継いでくれる可能性がある。

誰かが他のOSに移植してくれる。

・誰かがMacOS版を作りたいと思ったときに、ソースコードを見ずに移植した場合、どうして
 も互換性に問題が出る。
 しかし、ソースが公開されていれば、少ない手間でほぼ完全な移植ができる。
 環境に依存した部分は書き直したり、移植が難しい部分については機能を削ったりする
 必要があるけど、それでも一から書くよりはずっと楽。
 ちなみに、現在Windows以外の環境でサポート外の動いている場合、
 それは誰かが更新履歴の仕様を見て、オリジナルのコードを使わずに
 クラックして移植したものだ。ありがたいことだけど、
 もしソースが公開されていたらこの作業は不要だったはずで、その人はもっと別の作業ができた。

バグを修正できる
・誰かがバグを見つけ、それを報告したとする。
 それをみた第三者かが、ソースコードの中から原因を見つけて、
 作者に「ここを直せばいいぞ」と教えてくれる可能性がある。
 ひょっとしたら修正したソースコードをupしてくれるかもしれない。

112 :111:2008/07/13(日) 13:52:00 .net
>>111 続き
自分で改良して、それを作者に提案できる。
・第三者ソフトウェアを見て「ここを改良したらもっと良くなるんじゃないのか?」
 もしくは「こんな機能を追加したらもっとよくなるんじゃないの?と誰かが思ったとする。
 その場合、公開されているコードを改良・追加し、作者に改良案や機能追加案を提案する
 ことができる。
 作者がその人の方がより開発に向いていると判断した人は、作者の許可を得て改良版を
 公開することができる。
 第三者が改良案や機能追加案を提案して作者がそれを見て、影響を受けて、第三者の
 改良版を使用しながら作者は更なる改良を加えることができる。
 ソースが公開されていなかったら、作者に具体的に改良案や機能追加案を
 提案することが難しい。

HDDが飛んでも即死しない
・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
  ソースがサーバ上にアップしていれば、作者のHDDが飛んでも、開発を続行することが
  できる。

とこんな感じなメリットがあります。
長文になってすいません。 ぜひご検討のほうよろしくお願いします。


113 :デフォルトの名無しさん:2008/07/13(日) 22:37:30 .net
でたーオプソ厨

114 :デフォルトの名無しさん:2008/07/14(月) 12:10:04 .net
>>110
>>111
>>112

それはいいアイディアですね。 ぜひやってもらいたいです。

115 :デフォルトの名無しさん:2008/07/14(月) 12:14:13 .net
反論するのも馬鹿馬鹿しいが。
>・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
これを字義通りに受け取る(或いはそのように敢えて振舞う)人がいることに驚いた。

116 :デフォルトの名無しさん:2008/07/14(月) 22:51:41 .net
俺が学生時代にちまちま作ってたしょぼいソフトは
まさしくその運命をたどったよ

117 :デフォルトの名無しさん:2008/07/15(火) 01:33:45 .net
そういや昔のプログラムはフロッピーに入れてたのでもう見れなくなったなw

118 :デフォルトの名無しさん:2008/07/15(火) 03:56:00 .net
実はハードごとまだ生きてる
子供の頃しこしこ打ち込んでた雑誌掲載のBASICゲームは起動メニューを作っておいたので
ファイル名すら覚えてなくても今でも遊べる
子供時代の自分の聡明さにしばし感動
今はもう駄目かもわからんね

119 :デフォルトの名無しさん:2008/07/15(火) 21:05:07 .net
そこで FILES

120 :デフォルトの名無しさん:2008/07/19(土) 12:36:03 .net
>>109
おーい。94氏 オープンソース化しないのかい?
返事をくれ。

121 :デフォルトの名無しさん:2008/07/19(土) 13:34:24 .net
自分の要求のために他者に負担をかけることを当然のように考えてるからオプソ「厨」って付くんだな。

122 :デフォルトの名無しさん:2008/07/19(土) 13:55:25 .net
某コナンの蝶ネクタイ型変声機みたいな物は作れないかなぁ
他人の声からパラメータだけ抽出して、云々

123 :デフォルトの名無しさん:2008/07/19(土) 14:16:39 .net
既にあるんですね...

124 :デフォルトの名無しさん:2008/07/19(土) 17:00:43 .net
オプソ厨って、自作自演だよw
シェア作家のなw

125 :デフォルトの名無しさん:2008/07/20(日) 10:50:58 .net
>>124
そんなわけないだろうw

126 :94:2008/07/20(日) 12:22:06 .net
久々に見に来たらレス増えてた。。。
オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ?
素材の音声データが無いと。それもかなりの量で。。

127 :デフォルトの名無しさん:2008/07/20(日) 14:54:58 .net
プログラムの権利より音声データの権利のほうが問題になりがち

128 :デフォルトの名無しさん:2008/07/20(日) 15:05:16 .net
>>122
1.マイクの声から声帯の影響を取り除く
2.フォルマントを他人の位置に移動する
でできるかも


129 :デフォルトの名無しさん:2008/07/20(日) 23:56:23 .net
>>126
>オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ?

それでもいいと思う。

自分の声のデータを入れて合成することもできるし。

オープンソースなら合成エンジンをもっと高性能化することもできるし。

使う側が改造できるだけでなく、作った側にも自分の技術を高める、新しい着想を得る

といった双方にメリットがあるかもしれませんし。


130 :デフォルトの名無しさん:2008/07/21(月) 01:03:03 .net
>>129
オープンソースって勝手に改変してくれる分にはいいけどパッチとか
送ってこられるとうざくない?
正直ソースが穢れるけど、拒否するとアンチ化しそうだし。

131 :デフォルトの名無しさん:2008/07/21(月) 02:24:44 .net
そりゃ、コミュニケーション力がないだけだな。
適当にあしらえばいいし、ソースは参考になるなら自分で書き直して入れましたでいい。

オープンソースと、みんなで開発はまた別だよ。

132 :デフォルトの名無しさん:2008/07/21(月) 02:29:45 .net
すべての会話音声を録音して流せば解決

133 :デフォルトの名無しさん:2008/07/21(月) 11:45:45 .net
>>109
>>94
このプログラムは「Alice Project」と同じようなことができるのかい?

又某コナンの蝶ネクタイ型変声機みたいな機能を追加する予定とかはあるのかい?

134 :デフォルトの名無しさん:2008/07/21(月) 20:30:25 .net
>>131
参考になるものは送ってこないから。
これだけは断言できる。
勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
しつこくしてくるのが関の山。
いやほんとしつこくされるよ。
住所なんか当たり前のように調べてくるしね。
それなりの覚悟がないとオープンソースは無理だよ。

135 :デフォルトの名無しさん:2008/07/21(月) 21:18:17 .net
どうでもいいがペンタックスの合成ライブラリはかなり巧い

136 :デフォルトの名無しさん:2008/07/21(月) 22:28:41 .net
>>134
そんなわけねえだろうよw
確かに参考になるものは送られてこないのは確かだけど、しつこくは
されないだろう。

しかもメールアドレスを公開しないでオープンソース化すればいいだけの話。

137 :デフォルトの名無しさん:2008/07/21(月) 22:32:25 .net
オープンソース化ってもごく一部のソフト以外はパッチが送られてくるどころか読まれることすらほとんどなさそーな悪寒。

138 :デフォルトの名無しさん:2008/07/21(月) 23:19:57 .net
てか、ソース見せ合うだけなら
どっかに無料のうpロダ用意してそこに勝手にソースをうpしたり、落としたりすれば良いんでは?

139 :デフォルトの名無しさん:2008/07/22(火) 00:15:42 .net
反オプソ厨は、言い訳が稚拙なのがなw

普通に、手柄を独り占めしたい、ソースを見せたくない、でいいんだよw

140 :デフォルトの名無しさん:2008/07/22(火) 00:48:55 .net
>>136
じゃぁそうしてみろよ。
どっかのロダに匿名で上げて見れ。
おれの創作物を勝手にオープンソースにしやがったってやつが3人は
出てくるから。
そうすればオープンソース厨の怖さが少しは理解できるだろ。
奴らは(無料も含めた)金のためなら何でもするからな。

141 :デフォルトの名無しさん:2008/07/22(火) 01:16:48 .net
>>139
バカなオプソ厨を装った釣りとかネタか?
作った人間が手柄を独り占めできるのは当然の権利で言い訳とかいらんだろ?
むしろオプソ厨のほうが「あなたの手柄をタダ取りしたいんでソース見せてください」ってのを
いかにオブラートにくるんでうまく言えるか工夫しなきゃいけない立場なのに。

142 :デフォルトの名無しさん:2008/07/22(火) 01:24:19 .net
>>141
だったら言い訳しなくていいよw 言い訳するってのは、何らかの心の働きだから。
いちいち、オプソ厨がウザイとか、ソースが汚いから見せるのが嫌だとか、しょうもない言い訳はいらんから。

まぁ、他の人のソースパクってて本当に見せられない奴も中にはいるだろうけどw

143 :デフォルトの名無しさん:2008/07/22(火) 01:37:40 .net
>>142
え?マジなの?本当はオプソ厨のふりしたネガキャンだよな?

144 :デフォルトの名無しさん:2008/07/22(火) 23:53:47 .net
>>140
だったらGPLもしくはGNU等のライセンスで公開すれば?
ちなみに、俺もオープンソースで公開したんたが、そんなことはなかったと思うな。

145 :デフォルトの名無しさん:2008/07/23(水) 00:00:43 .net
誰か再うpしてくれないか
間違えて削除してしまった

146 :デフォルトの名無しさん:2008/07/23(水) 00:23:13 .net
>>144
匿名でGPL等でうぷした場合の話だろ。
おまえは都合の悪い話は一切読めないのか?

クレクレ言ってる時点でオプソ厨のニオイがプンプンしてるんだよ。

匿名じゃない場合は過去ログ参照。

147 :デフォルトの名無しさん:2008/07/23(水) 01:01:07 .net
こういう流れを作ってグダグダにするのがオプソ厨の狙いなんだから相手するなよw

148 :デフォルトの名無しさん:2008/07/23(水) 03:23:34 .net
嫌なら嫌だって言えば良いだけだしな。
つーか、厨はクローズドの方がよってくると思うがw
あれしてくれ、これしてくれってw

オープンソース・フリーソフトなら、自分でやれ!で終わるw

149 :デフォルトの名無しさん:2008/07/23(水) 08:28:05 .net
もし公開するならある程度完成度をあげてからの方がいいよ。オリジナルは俺だと主張できるくらいにね。
中途半端なソースを公開する必要なんて無い。

150 :デフォルトの名無しさん:2008/07/23(水) 13:10:13 .net
実際の声からサンプリングするんじゃなくて、人間の声帯を物理モデリングして作れよ。

151 :デフォルトの名無しさん:2008/07/23(水) 16:14:23 .net
式うpしてくれ

152 :デフォルトの名無しさん:2008/07/24(木) 02:26:56 .net
まずは模型を作るところから始めるんだ

153 :デフォルトの名無しさん:2008/07/25(金) 16:16:30 .net
>>146

>勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
>しつこくしてくるのが関の山。
>いやほんとしつこくされるよ。
>住所なんか当たり前のように調べてくるしね。

匿名なのにどうやって送りつけるんだい?
話が矛盾してるぞ。

154 :おい:2008/07/25(金) 17:56:19 .net
Shut the fuck up and write some code.

155 :デフォルトの名無しさん:2008/07/25(金) 21:14:17 .net
>>153
ほんとに頭の悪い子だな。
頭の悪さは公表しなくていいからそっと隠しておけよ。
100回読みなおせばお前でも理解できるかも知れんから読みなおせ。

156 :デフォルトの名無しさん:2008/07/25(金) 22:09:22 .net
とりあえず Win + U×2 しとけ

157 :デフォルトの名無しさん:2008/07/25(金) 23:05:35 .net
自分の声から音声を合成し、入力したテキストを読み上げられるソフトを、OKIが発売した。病気などで声を失った人に、自分の声の代わりに使ってもらいたいという。
http://www.itmedia.co.jp/news/articles/0807/25/news011.html

158 :デフォルトの名無しさん:2008/07/26(土) 00:49:05 .net
声を失った人が、自分の声から音声を合成することは出来ないと思うのだが

159 :158:2008/07/26(土) 00:50:41 .net
って書いてから記事を読んで理解した。すまそ。

160 :デフォルトの名無しさん:2008/07/27(日) 00:18:05 .net
>>146
そんなの匿名でやればいい話

161 :デフォルトの名無しさん:2008/07/27(日) 00:26:50 .net
まだ作ってないのかおまえら

162 :デフォルトの名無しさん:2008/07/27(日) 09:42:30 .net
>>160
だからお前がやればいいだろ。
オプソ厨の最大の欠点は、人が作ったものはクレクレ言って、オプソにしなければ
ならないと一生懸命言うけど、自分では何も作らないことだな。
社会正義のためとか言うけど、そんなものに興味があるなら自分でやれ。
おれは全然興味ない。

163 :デフォルトの名無しさん:2008/07/27(日) 11:30:58 .net
ところでバーローの蝶ネクタイ型変声機みたいな物はできるのかね?


164 :デフォルトの名無しさん:2008/07/27(日) 11:56:39 .net
ぼかりすは似たようなもんだと思う。

165 :デフォルトの名無しさん:2008/07/27(日) 14:23:25 .net
韻律も含めて他人の声に変換してもらいたいなー

166 :デフォルトの名無しさん:2008/07/27(日) 16:18:32 .net
しかし、オープンソースにするとパッチとかがウザイとか言うけど、
どう考えてもクローズドの方が、オープンにしろって要望も含めて、あれやってくれこれやってくれって五月蝿いと思うがw

まぁ、かまってちゃんならそっちの方がいいんだろうけどw

167 :デフォルトの名無しさん:2008/07/27(日) 19:03:07 .net
某コナンの蝶ネクタイ型変声機みたいな物はどうやって作るんだい?
そのアルゴリズム等を提案してみてください。

168 :デフォルトの名無しさん:2008/07/27(日) 20:30:52 .net
変声機はどっちかというと、元の音声をいかに消すかが肝だと思うw

169 :デフォルトの名無しさん:2008/07/27(日) 20:37:01 .net
音声認識して音声合成しなおせばいいんじゃね?

170 :デフォルトの名無しさん:2008/07/29(火) 12:29:37 .net
ところで音声合成ってどうやって作るんだい?
アルゴリズムを提案してくれ。

171 :デフォルトの名無しさん:2008/07/29(火) 17:44:36 .net
基本は、サンプリングのツギハギ。
声帯を物理シミュレーションしてるのは、あるのかな?

172 :デフォルトの名無しさん:2008/07/30(水) 01:18:20 .net
>>170
ttp://recognition.web.fc2.com/synthe/

>>171
党・本多


173 :デフォルトの名無しさん:2008/08/01(金) 00:14:21 .net

94氏
この掲示板みてたら、現状を報告してくれ。

174 :デフォルトの名無しさん:2008/08/03(日) 19:07:12 .net
変声機つくっても犯罪用途しか思いつかないなぁw

175 :デフォルトの名無しさん:2008/08/03(日) 20:42:59 .net
マイナー分野である音声合成技術が、オレオレ詐欺に使われることで一躍世間の注目を浴びる、と。

176 :デフォルトの名無しさん:2008/08/03(日) 21:08:32 .net
それ既にあるぞ

177 :デフォルトの名無しさん:2008/08/04(月) 19:12:59 .net
こんなんみつけた
ttp://d.hatena.ne.jp/shoozhoo/20080712

やっぱ英語用の音声合成は日本語じゃ役立たずなのか?

178 :デフォルトの名無しさん:2008/08/06(水) 22:21:13 .net
ところで誰か音声合成プログラムを作っている人いるかね?

179 :デフォルトの名無しさん:2008/08/12(火) 00:25:48 .net
ボイーン

180 :デフォルトの名無しさん:2008/09/04(木) 03:02:37 .net
>>171
面白い特許を見つけました。シンセサイザーの方では表現力が高いとして
90年代に研究され尽くされた物理モデリングアルゴリズムDWGを
音声シンセサイザーに応用するものです。
http://www.patentgenius.com/patent/5528726.html


181 :デフォルトの名無しさん:2008/09/08(月) 11:38:26 .net
よく見つけたな。ちょっと読んでみるか

182 :デフォルトの名無しさん:2008/09/15(月) 06:39:06 .net
http://prius.hitachi.co.jp/prius/pc/2005may/yomiwaza/index.html
>※本ソフトウェアが出力する読み上げ音声の著作権は株式会社 日立製作所が保有します。

これってどうなの?
ここまで著作権を主張できるもんなの?

183 :デフォルトの名無しさん:2008/09/15(月) 10:37:50 .net
フォントの著作権の問題に似てるな

184 :デフォルトの名無しさん:2008/10/14(火) 11:10:46 .net
そろそろ何か作りれたか?

185 :デフォルトの名無しさん:2008/10/14(火) 21:24:36 .net
日本語でおk

186 :デフォルトの名無しさん:2008/10/18(土) 15:12:50 .net
>>94氏へ
この掲示板みてたら、なんでもいいから報告をしてくれ。

187 :デフォルトの名無しさん:2008/12/24(水) 02:45:19 .net
http://iwasete.net/

188 :デフォルトの名無しさん:2009/01/03(土) 11:49:06 .net
age


189 :デフォルトの名無しさん:2009/02/05(木) 07:16:16 .net
保守

190 :デフォルトの名無しさん:2009/02/05(木) 11:09:11 .net
>>182
しかし読み上げた結果の音声を自由に使えなきゃ意味ないよな。

191 :デフォルトの名無しさん:2009/02/05(木) 11:11:41 .net
そういえば、ちょっと前にアニメのキャラクターで音声合成するのがあったけど、あのベースになっているアルゴリズムはなんなんだろ。
藤崎モデルだっけ、あれとはちょっと違うでしょ?

192 :デフォルトの名無しさん:2009/02/08(日) 10:49:41 .net
波形接続だろ

193 :デフォルトの名無しさん:2009/02/08(日) 11:15:27 .net
でも、通常の波形接続リソースとは変えないとキャラっぽいしゃべりは無理だろ?

194 :デフォルトの名無しさん:2009/02/09(月) 00:16:52 .net
キャラ声でキャラせりふを録音しておくんだからOKだろ?

195 :デフォルトの名無しさん:2009/02/09(月) 09:26:51 .net
それじゃうまくいかないんじゃないか?
とはいえ、音声リソースに手作業で情報追加すれば何とかなるのかや。

196 :デフォルトの名無しさん:2009/02/09(月) 10:49:52 .net
量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。


197 :デフォルトの名無しさん:2009/02/10(火) 23:16:28 .net
>>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。

198 :デフォルトの名無しさん:2009/02/14(土) 04:41:05 .net
overlap add

199 :デフォルトの名無しさん:2009/02/17(火) 14:31:50 .net
>>198
わからんな、単語並べられてもさ。

200 :デフォルトの名無しさん:2009/02/17(火) 20:41:36 .net
>>191 のアルゴリズムがoverlap additionだと言いたいんだろうな

201 :デフォルトの名無しさん:2009/02/23(月) 11:31:09 .net
簡単な波形接続プログラム作ってみた
Ne_46114
makaron


202 :デフォルトの名無しさん:2009/02/23(月) 18:17:57 .net
ttp://www1.axfc.net/uploader/Ne/so/46114
みんながみんなお前や俺のようなワレザーじゃないんだからURLを併記するべき
それはそうと入力した語句がwavに反映されない。

buliding database
done
input text


こんにちわ。

1 sp /*/ 614 400 242

203 :デフォルトの名無しさん:2009/02/24(火) 08:14:40 .net
申し訳ない。上でそこ使ってたから、デフォかと思ったよ。

で、音が出ないってのだけど、dataフォルダの中にポッドキャストの
wavファイルは作ってあるんだよね?んー、なんでだろう。

204 :デフォルトの名無しさん:2009/02/24(火) 21:59:55 .net
もちろん
全てREADMEの通りに行った
原因が思いつかないなら結構場所食うし消すわ

205 :デフォルトの名無しさん:2009/03/09(月) 12:22:15 .net
>>202
すいません。それをもう一度うpしてくれませんか?

後このソフトはオープンソースですか?


206 :デフォルトの名無しさん:2009/03/09(月) 20:05:03 .net
おっと盗賊が現れた。

207 :デフォルトの名無しさん:2009/03/11(水) 12:26:04 .net
>>201
>>202のURLからダウンロードできないんだが・・・
もう一度うpしてくれるか?

208 :デフォルトの名無しさん:2009/03/11(水) 12:44:47 .net
もうなくなっているようだな。

209 :デフォルトの名無しさん:2009/03/11(水) 15:14:17 .net
だれでもいいからうpしてくれ


210 :デフォルトの名無しさん:2009/03/26(木) 11:58:27 .net
そういえば、声を好きな人の声に変換するものがあったけど、あのアルゴリズムはどうなっているんだろう?

211 :デフォルトの名無しさん:2009/03/31(火) 09:09:02 .net
好きな人の声ってなんだよ?

212 :デフォルトの名無しさん:2009/03/31(火) 11:13:33 .net
俺で言えば佐伯香織ちゃんの声だよ

213 :デフォルトの名無しさん:2009/03/31(火) 17:26:09 .net
音声認識して音声再生してるだけじゃないの?

214 :デフォルトの名無しさん:2009/04/03(金) 15:48:54 .net
>>210
それって声質変換のことじゃないの?
声質変換って声の周波数で他人の声に変えることかな?

215 :デフォルトの名無しさん:2009/04/04(土) 00:09:17 .net
ふぉるまんと0の成分を上げ下げすればいいんじゃね?

216 :デフォルトの名無しさん:2009/04/04(土) 20:24:59 .net
>>215
それで本当に他人の声に変えることができるの?
だれか詳しい人教えて

217 :デフォルトの名無しさん:2009/04/05(日) 02:42:50 .net
>>216
おとこ、おんな、こども、
っぽく変換はできる。

でも、20年前の技術だぞ?

218 :デフォルトの名無しさん:2009/04/11(土) 16:55:30 .net
声質変換技術で他人の声の変換するにはどのようにすればいいのかな?

219 :デフォルトの名無しさん:2009/04/11(土) 20:22:18 .net
んなの英語の論文調べなよ。

220 :デフォルトの名無しさん:2009/05/25(月) 22:41:33 .net
声優いわく、BIGLOBEのコエラボは5日間の収録だそうだぞ

221 :デフォルトの名無しさん:2009/05/26(火) 22:16:46 .net
ttp://pinpon.okilab.jp/potential.html
ワロタww

222 :デフォルトの名無しさん:2009/05/27(水) 00:07:24 .net
>>221
ちょーやばくねー。

223 :デフォルトの名無しさん:2009/05/31(日) 03:43:40 .net
>>221
なんかムカつく。でもそれがいい

224 :デフォルトの名無しさん:2009/06/30(火) 15:03:16 .net
age

225 :デフォルトの名無しさん:2009/07/02(木) 08:08:16 .net
なぜ、VOICE TEXTがでてこない・・・
市販の音声合成ではあれの出来がかなりよい

226 :デフォルトの名無しさん:2009/07/02(木) 21:18:35 .net
Harukaってコメント程度ならいいけど、
聞き続けるとムカつきそうw

227 :デフォルトの名無しさん:2009/07/03(金) 08:01:09 .net
>>226
確かにw
最初は可愛いと思うがだんだんゆとりの女子高生に思えてきたw

228 :デフォルトの名無しさん:2009/08/13(木) 20:00:14 .net
声質を変換できる方法ってあるのかな?

229 :デフォルトの名無しさん:2009/08/13(木) 20:17:19 .net
うん

230 :222.248.109.70:2009/08/17(月) 17:45:20 .net
Q. 自動保守#K9K?_D[L とは一体何なのか?
A. 外部サイトへの突撃大好きな真性厨房

韓国突撃でお馴染みの自動保守
最近は自動焼人 ★として2ちゃんねるのボランティアにも精を出す日々
だがそんな彼にも、人間らしい部分はあったのだ…

名言集
『アパッチ砲はワシが作った』
『お前が規制系キャップ取れるか審査してやるよ』
『いつもサボってばかりのキャップがウゼえ』
『俺、100人規模の集団サイバーテロの主犯だったこともあるんだぜ』
『俺の経歴カックイイだろ?』

最近のニュース
 8月15日の韓国突撃の際に歴史的大敗を喫する。ラジオでの敗戦宣言のときに声が震えていた
 本人は体調不良と言っているが…


----------------------------------------------
この自動焼人 ★メールマガジンの配信停止をご希望される方は
http://qb5.2ch.net/test/read.cgi/sec2chd/1250169591/
にて自動焼人 ★までご連絡ください

231 :デフォルトの名無しさん:2009/08/31(月) 22:39:57 .net
声質を変換できる方法ってあるの?

232 :デフォルトの名無しさん:2009/08/31(月) 22:42:46 .net
うん

233 :デフォルトの名無しさん:2009/10/03(土) 16:56:55 .net
ほしゅ

234 :デフォルトの名無しさん:2009/10/04(日) 11:19:20 .net
VOCALOID2 シーケンス (VSQ) ファイルのフォーマット (推定)
ttp://www5d.biglobe.ne.jp/~noocyte/Programming/FileFormat/VSQ.html

235 :デフォルトの名無しさん:2010/02/11(木) 11:05:27 .net
つOpenJtalk

236 :デフォルトの名無しさん:2010/02/14(日) 19:22:47 .net
肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう?
誰か教えて

237 :デフォルトの名無しさん:2010/02/15(月) 07:51:28 .net
あったね

238 :デフォルトの名無しさん:2010/02/16(火) 14:06:08 .net
>>237
どうやるの?

239 :デフォルトの名無しさん:2010/02/16(火) 21:04:17 .net
やっぱり音響モデルじゃないのかな

240 :デフォルトの名無しさん:2010/02/16(火) 23:34:34 .net
>>239
音響モデル?
詳しく教えて

241 :デフォルトの名無しさん:2010/02/27(土) 20:30:27 .net
肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう?
誰か教えて

242 :デフォルトの名無しさん:2010/02/27(土) 23:15:36 .net
あったね

243 :デフォルトの名無しさん:2010/02/27(土) 23:24:51 .net
>>242
どうやるの?

244 :デフォルトの名無しさん:2010/02/28(日) 13:02:52 .net
やっぱり音響モデルじゃないのかな

245 :デフォルトの名無しさん:2010/02/28(日) 16:19:26 .net
>>244
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの?

246 :デフォルトの名無しさん:2010/02/28(日) 17:41:40 .net
肖像画からCGを作成するのは六角大王の手法でできるんじゃね

247 :デフォルトの名無しさん:2010/02/28(日) 18:38:51 .net
涼宮ハルヒのエンドレス夏休みを見ている気分ですねわかります

248 :デフォルトの名無しさん:2010/03/02(火) 23:08:24 .net
>>246
どうやってやる?

249 :デフォルトの名無しさん:2010/03/21(日) 23:17:01 .net
マジレスすると、頭蓋のサイズから声道長を推定して、
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。


250 :デフォルトの名無しさん:2010/04/12(月) 00:29:58 .net
>>249
肖像画からどうやって頭蓋のサイズを出してるの?

251 :デフォルトの名無しさん:2010/04/12(月) 19:11:06 .net
俺の写真から声を復元したとして、
俺の声にどこまで近くなるんだろうか?

252 :デフォルトの名無しさん:2010/04/12(月) 23:10:15 .net
>>251
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの?

253 :デフォルトの名無しさん:2010/04/15(木) 12:59:30 .net
その写真に写りこんでいる、寸法の判っているものを基準にすればいいんじゃね

254 :デフォルトの名無しさん:2010/04/15(木) 17:26:26 .net
ネッシーの捏造写真だってサイズ割り出されてたもんな

255 :デフォルトの名無しさん:2010/04/15(木) 17:34:19 .net
波紋の伝播周期からサイズが決定できるってことかな。

256 :デフォルトの名無しさん:2010/04/15(木) 19:19:57 .net


257 :デフォルトの名無しさん:2010/04/15(木) 22:31:48 .net
w

258 :デフォルトの名無しさん:2010/04/17(土) 18:26:20 .net
>>253
でも肖像画に寸法の判っているものがなかったらどうするの?

259 :デフォルトの名無しさん:2010/04/17(土) 20:29:56 .net
何でお前らそんなに世話焼きなの?

260 :デフォルトの名無しさん:2010/04/19(月) 11:43:36 .net
>>258
そんときは、目玉の大きさとか目の感覚とか、統計的手法に頼ればいいんじゃね

>>259
暇なんじゃね?

261 :デフォルトの名無しさん:2010/04/19(月) 13:10:40 .net
>>258
声のキャラクタってのは体格以外の要素も絡むわけで、
例えば故人の歌声を再現、とかやりたい場合は大抵残念な結果になるよ。
そもそもここで聞くより元の論文探して見当つけたほうが早くね?

>>260
こういうのも頭部画像だけで測れちゃったり?
ttp://m.onet.pl/_m/94cfc8bff0ea6227e4a8547781d30f45,35,1.jpg
ttp://image.blog.livedoor.jp/laba_q/imgs/1/9/19f92fc1.jpg

262 :デフォルトの名無しさん:2010/04/19(月) 19:22:54 .net
サイズはパラメータにしておいて、
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない

263 :デフォルトの名無しさん:2010/04/20(火) 17:55:12 .net
>>261
ググッても見つからないんだが・・・

264 :デフォルトの名無しさん:2010/04/21(水) 19:02:15 .net
>>261
探しても見つからないよ

265 :デフォルトの名無しさん:2010/04/22(木) 22:39:13 .net
一卵性双生児の場合、声(歌声も)は全く同じではないだろ
だから頭部の数値だけでは不十分な気がする

266 :デフォルトの名無しさん:2010/04/22(木) 22:56:07 .net
>>265
でも↓を見ると
http://www.onkyo-lab.com/mv.html

>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。

って書かれているんだが・・・・

てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

267 :デフォルトの名無しさん:2010/04/22(木) 22:58:41 .net
声を合成できる事と
その声が実際の声と一致している事とは別だよ

268 :デフォルトの名無しさん:2010/04/23(金) 13:27:11 .net
>>267
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?

269 :デフォルトの名無しさん:2010/04/23(金) 23:17:59 .net
日本音響研究所に不可能はない

270 :デフォルトの名無しさん:2010/04/24(土) 00:03:36 .net
>>269
だからどうやってやったの?

271 :デフォルトの名無しさん:2010/04/24(土) 00:15:07 .net
日本音響研究所のおっさんに直接聞けよ

272 :デフォルトの名無しさん:2010/04/24(土) 23:13:48 .net
>>271
直接聞いても企業秘密で答えてくれない
おまえらの力で考えるしかない

273 :デフォルトの名無しさん:2010/04/25(日) 09:48:56 .net
>>266
肖像画が残るような人物なら性別は記録からすぐ分かるだろ
低脳

顔の各部分の寸法に関しては、
肖像画とその人物の民族平均を比較するんだよ。
低脳


274 :デフォルトの名無しさん:2010/04/27(火) 23:30:32 .net
【歴史】169センチ、62キロだった龍馬 大男伝説に一石 山梨
http://tsushima.2ch.net/test/read.cgi/newsplus/1272325001/
甲州の研究家襟幅から算出
甲州市塩山上井尻の郷土史研究家、矢崎勝巳さんが写真から体格を測定する方法を
考案し、幕末の志士・坂本龍馬(1835〜67年)の身長を169センチ、体重を62・1キロと
算出した。平均身長が150センチ台だった幕末当時、龍馬の身長は5尺7寸(173センチ)
とも6尺(182センチ)とも伝えられ、長い間大男だったとされてきたが、一石を投じそうだ。

矢崎さんは、当時の着物の襟幅が6センチか6・5センチの2種類しかないことに着目した。
6センチとすると背が低くなりすぎるため、6・5センチとして龍馬の立位の肖像写真で算出した。
2007年10月の日本人類学会で、龍馬の身長は170センチに満たなかったとの試算を
紹介したのに続き、昨年10月の同学会では体格指数BMIで体重を試算する方法も発表した。

このほど、龍馬のBMI指数を標準体形の「18・5以上25未満」と仮定し、標準値の
(以下省略)

ソース:読売新聞
http://www.yomiuri.co.jp/e-japan/yamanashi/news/20100426-OYT8T01349.htm
画像:坂本龍馬の肖像写真
http://www.yomiuri.co.jp/photo/20100426-932069-1-L.jpg

275 :デフォルトの名無しさん:2010/04/27(火) 23:58:20 .net
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

276 :デフォルトの名無しさん:2010/04/28(水) 18:02:44 .net
おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

277 :デフォルトの名無しさん:2010/04/28(水) 18:36:50 .net
ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの?

278 :デフォルトの名無しさん:2010/04/28(水) 20:13:21 .net
そして誰もいなくなった

279 :デフォルトの名無しさん:2010/04/29(木) 23:02:27 .net
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

280 :デフォルトの名無しさん:2010/04/30(金) 01:37:52 .net
男の声をピッチ上げるだけだと、女っぽくならないのは何故だろう

281 :デフォルトの名無しさん:2010/04/30(金) 01:50:08 .net
ボカロで言うGENとかUTAUでいうgフラグを調整する必要がある

282 :デフォルトの名無しさん:2010/05/01(土) 14:24:27 .net
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

283 :デフォルトの名無しさん:2010/05/01(土) 19:24:01 .net
ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

284 :デフォルトの名無しさん:2010/05/04(火) 18:39:42 .net
おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう?

285 :デフォルトの名無しさん:2010/05/04(火) 23:25:22 .net
発声時における声帯から口までの空気の流れを粒子法でモデル化して
音声合成を作ってみたいと急に思い立ったんだが、右も左も分からない。

とりあえず、これは圧縮性流れと見なしてシミュレートすればいいのか

286 :デフォルトの名無しさん:2010/05/06(木) 23:04:54 .net
ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?

287 :デフォルトの名無しさん:2010/05/07(金) 00:23:20 .net
>>286
一般的には統計を利用する。

288 :デフォルトの名無しさん:2010/05/07(金) 16:24:45 .net
>>287
どうやってやるの?
具体的に教えてくれる?

289 :デフォルトの名無しさん:2010/05/07(金) 16:57:59 .net
てかそもそも証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?

290 :デフォルトの名無しさん:2010/05/20(木) 15:00:33 .net
証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?

291 :デフォルトの名無しさん:2010/06/08(火) 23:57:00 .net
ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?

292 :デフォルトの名無しさん:2010/06/11(金) 13:49:50 .net
>>291
とりあえず証明写真見て性別を5割以上の確率で当てられないバカはお前くらいじゃねーの

293 :デフォルトの名無しさん:2010/06/12(土) 22:08:09 .net
ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?

294 :デフォルトの名無しさん:2010/06/12(土) 23:22:47 .net
きっと後ろの壁に横線が並んでるんだよ。

295 :デフォルトの名無しさん:2010/06/13(日) 15:05:51 .net
うん。だけど証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの?

296 :デフォルトの名無しさん:2010/07/06(火) 18:15:36 .net
>>1を見て
鏡の国のレジェンドでのりぴーの声を1音ずつ喋らすことができるんだけど
それを録音してX68にADPCMで取り込んでおいて順次再生して「おまんこ」とか
「ちんちんいれて」とか喋らせて大喜びしてたのを思い出した

297 :デフォルトの名無しさん:2010/12/07(火) 04:06:55 .net
音について質問です

例で
Windows Wave 無圧縮 PCM 16 bit 44kHz サンプリング ステレオ

wav format
http://www.kk.iij4u.or.jp/~kondo/wave/#wav
http://hooktail.org/computer/index.php?Wave%A5%D5%A5%A1%A5%A4%A5%EB%A4%F2%C6%FE%BD%D0%CE%CF%A4%B7%A4%C6%A4%DF%A4%EB

波形データはステレオの場合LRLR・・ と並ぶなどの説明までは沢山の日本語サイトであるんですけど
その多くがWAV ファイルヘッダ情報ばかり詳しく述べて肝心のデータ部分の説明がおざなりで解りません。

波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 FFFF8000 〜 0 〜 7FFF

リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。

data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR ですよね。

解らないのは、リニア PCM の場合
整数16bit / リトルエンディアン
L0L1L2L3  / L3 L2 L1 L0
R0R1R2R3  / R3 R2 R1 R0

格納順番は
これ?> data (波形データのバイト数) L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0
コレ?> data (波形データのバイト数) L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0

日本語サイトでここが詳しいとリンクしている英語サイト
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
では矢印のつけ方がどちらとも受け取れるので
音が変

298 :デフォルトの名無しさん:2010/12/07(火) 07:51:53 .net
>リトルエンディアン にすると 00 80 FF FF 〜 00 00 00 00 〜 FF 7F 00 00 ですよね。

それ32bitじゃね?

299 :デフォルトの名無しさん:2010/12/07(火) 14:18:42 .net
>>297
16ビットは2バイトだと気がつけば格納順番も分かると思います。

波形データ符号付き整数 (-32768 - 32767) 16ビットの場合 8000 〜 0 〜 7FFF
リトルエンディアン にすると 00 80 〜 00 00 〜 FF 7F
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR

整数16bit/リトルエンディアン
L0L1  / L1 L0
R0R1  / R1 R0

格納順番はこうなります。
data (波形データのバイト数) L1 L0 R1 R0 L1 L0 R1 R0 L1 L0 R1 R0

300 :デフォルトの名無しさん:2010/12/07(火) 23:06:21 .net
SAPIの話かと思ったらすれ違いみたい

301 :297:2010/12/08(水) 08:25:46 .net
ありがと やっと謎がとけたよ
音声組替えで音の基本配置がわかんなかったから音声合成のこのスレにきたんですが スレ違いごめんなさい
変調なんかもドコのスレだろ?

302 :デフォルトの名無しさん:2010/12/09(木) 02:03:55 .net
グーグル検索

念のためうぷ(´・ω・`)まわいが重要


グーグル検索

やらなくてもやられるし 日本語以外話せないし


テレビやネットで説明

303 :デフォルトの名無しさん:2011/01/05(水) 18:49:53 .net
>>1
何という手間のかかる事を...。
波型とかエンベロープとか、学ばなきゃいけない事が、
山ほどあるのに。

304 :デフォルトの名無しさん:2011/01/15(土) 16:12:14 .net
これの話者適応とか使えそうなんだけど、具体的なやり方がわからん
http://www.sp.nitech.ac.jp/index.php?%A5%DB%A1%BC%A5%E0%2F%B8%A6%B5%E6%C6%E2%CD%C6%2F%B2%BB%C0%BC%B9%E7%C0%AE

305 :デフォルトの名無しさん:2011/01/15(土) 17:34:46 .net
>>304
話者適応は英語で Speaker Adaptation です。
HMM音声合成ツールキット HTS 2.0以降に
その機能があるのでソースを読めばわかると思います。

HMM-based Speech Synthesis System (HTS) - History
http://hts.sp.nitech.ac.jp/?History#z5d7dda6
>December 29, 2006
> HTS version 2.0 was finally released :-)
> The new features are
> * Speaker adaptation, adaptive training, and semi-tied covariance transforms are supported for multi-stream HMMs/MSD-HMMs.
>  * MLLRMEAN, MLLRCOV, and CMLLR-based adaptation.
>  * CMLLR-based adaptive training.
>  * Decision trees for context clustering can be used to define regression classes for adaptation.
>  * HMGenS can read MLLRMEAN, MLLRCOV, CMLLR, and SEMIT transforms for adaptation.

306 :デフォルトの名無しさん:2011/01/15(土) 22:00:38 .net
>>305
サンクス。ドキュメント見ながら色々試してみようと思う
とりあえずHTSの話者適応デモ動かしてるけど、終わらないし、2〜3日かかるらしい
最終的にはwavファイルとその文章を与えたらその声で音声合成できるようにしたい

307 :デフォルトの名無しさん:2011/01/24(月) 21:38:46 .net
統計学と信号処理と音声言語処理と機械学習を
勉強すれば何とかなるかな。

308 :デフォルトの名無しさん:2011/02/06(日) 11:25:55 .net
>>306
できた?興味あるんだけど

309 :デフォルトの名無しさん:2011/02/17(木) 17:24:58 .net
>>308
できてない
とりあえず、デモのデータを使って音響モデルを作成するところまでできた
音響モデルができたらテキストからその声で音声の再生もできる
今は、自作のデータからモデル作る途中でエラーが出てるからそれの対処中

310 :天使 ◆uL5esZLBSE :2011/07/03(日) 09:38:03.37 .net
Rubyバカにしてる子ってさ
変数に$ついてる言語触ってるって事だよね

いちいちSHIFT+4キーおして $ 打ちまくってる感触はどう?
でもお前はゴミなのにねw

311 :天使 ◆uL5esZLBSE :2011/07/06(水) 01:45:59.76 .net
これ ; デリミタっていうんだけどさ、これをつけなきゃエラーになるような
そんな言語使ってる奴ってどうみてもゴミだと思うんだけど

もしかして「;」これ打ち忘れてコンパイルエラー出すのが楽しいの?
そうか、二度と話かけんなよ

死ねよゴミ

312 :デフォルトの名無しさん:2011/08/02(火) 06:50:05.52 .net
ゆっくり声のライブラリって規則合成ってのらしいんだけど、これは素片接続法やHMM合成とは全く違う方法なの?素片接続の一種?

313 :デフォルトの名無しさん:2011/08/03(水) 19:03:56.08 .net
規則合成は、規則に基づいて音声合成することなので、合成方式が波形接続かHMM合成かとは別。というか、上の分類。
ゆっくりは、たぶん、LPCとかのパラメータからのボコーダ方式。ボコーダという点ではHMM合成と同じ。

314 :デフォルトの名無しさん:2011/08/05(金) 06:51:28.40 .net
>>313
ありがとう。勉強になります。

315 :デフォルトの名無しさん:2012/04/24(火) 14:08:11.51 .net
NHK Eテレ Rの法則という番組にて歌声合成が取り上げられるようです.
また,その企画に伴い,4/25から番組HPでUTAU音源がDL出来るようになります.
男声と女声の2音源です.その音源作りを担当させていただきました!


316 :デフォルトの名無しさん:2012/06/01(金) 11:31:32.53 .net
UTAUよりまともな音声合成ソフトないの?

317 :デフォルトの名無しさん:2012/07/09(月) 20:44:26.02 .net
日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの?
詳しく教えてくれ

318 :デフォルトの名無しさん:2012/07/16(月) 20:36:29.06 .net
日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの?
詳しく教えてくれ

319 :デフォルトの名無しさん:2012/08/12(日) 22:40:26.39 .net
誰かHMM音声合成を語れ

320 :デフォルトの名無しさん:2012/10/28(日) 13:39:03.63 .net
フジテレビの杏梨ルネってどこの技術?


321 :デフォルトの名無しさん:2013/05/01(水) 02:28:38.09 .net
>>320
なんかの記事でドコモのiコンシェルと同じを使ってるって言ってたな
それが確かならHOYAのVoiceTextってことになる

322 :デフォルトの名無しさん:2013/05/01(水) 02:32:16.90 .net
なるほど

323 :デフォルトの名無しさん:2013/05/04(土) 21:11:27.84 .net
おれの98は、ピポッと起動するから現在形

324 :デフォルトの名無しさん:2013/05/07(火) 15:12:54.26 ID:qEqQNQf6O.net
難しいな

325 :デフォルトの名無しさん:2013/06/27(木) 16:17:04.80 .net
              

326 :デフォルトの名無しさん:2013/10/18(金) 09:34:37.17 .net
http://www.nicovideo.jp/watch/sm21933917
http://www.nicovideo.jp/watch/sm21947823

327 :デフォルトの名無しさん:2013/11/03(日) 20:36:45.88 .net
初音ミクとか目標にしてるんだろうけど意外に奥が深いんだよ。

328 :デフォルトの名無しさん:2014/01/27(月) 14:18:06.62 .net
判ります

329 :デフォルトの名無しさん:2014/01/27(月) 15:00:50.44 .net
初音ミクどころか歌唱よりさらに難しいといわれる読み上げに見える

330 :デフォルトの名無しさん:2014/01/27(月) 15:05:33.72 .net
へっ?
どうみても歌唱やんこれ

331 :デフォルトの名無しさん:2014/03/08(土) 16:28:12.83 .net


332 :デフォルトの名無しさん:2014/04/04(金) 14:07:45.36 ID:Bqre4+dt.net
初音ミク、って専属の声優さんがいるんじゃなかったかな?
その声優さんを機械のような質感にしているだけだと思うけどな。

333 :デフォルトの名無しさん:2014/04/04(金) 14:11:49.55 ID:UPfoP0f4.net
藤田咲さん
https://www.youtube.com/watch?v=yEDDVOmtbic

334 :デフォルトの名無しさん:2014/04/07(月) 10:02:18.51 ID:Eg/nEWhY.net
>>333
紹介ありがとう。
やっぱり専属の声優さんいたんやな。

335 :デフォルトの名無しさん:2014/04/07(月) 10:05:42.81 ID:Eg/nEWhY.net
声優さんの合成音声をセリフから抽出するより。
お気に入りの声優さんに「あ〜ん」までを発声してもらって。
それをタイピングと連動させるツールを作ればいいんでね?


音域を解析して、ネットラジオ等で音声素材を収集して。
埋められない言葉は、これまで収集したデータから予測するのは・・・。
考えただけでかなりのコスト^^;

336 :デフォルトの名無しさん:2014/04/07(月) 10:36:56.71 ID:SBlJ2Fr+.net
こんなん出てたわ

https://www.youtube.com/watch?v=tUIQItrpYBE
https://www.youtube.com/watch?v=RyezC1p_pak
http://internet.watch.impress.co.jp/docs/news/20140404_642876.htm
http://game.watch.impress.co.jp/docs/news/20140221_636384.html
http://gigazine.net/news/20140404-pocket-miku/
http://nlab.itmedia.co.jp/nl/articles/1403/03/news057.html
http://japanese.engadget.com/2014/03/02/evocaloid/
http://www.amazon.co.jp/dp/4057504656/
http://www.dtmstation.com/archives/51888898.html
http://hitoriblog.com/?p=23019
http://www.otonanokagaku.net/nsx39/index.html
http://www.dtmstation.com/archives/51877546.html
http://otonanokagaku.net/nsx39/app.html
http://www.crypton.co.jp/cfm/news/2014/02/pocketmiku

歌詞モードは知らんけど
リアルタイムモードは子音がサポートされてないのが残念

リアルタイムでも子音出せるのはこちら

https://www.youtube.com/watch?v=ka8-SpSkmZA
http://vocaloid.blog120.fc2.com/blog-entry-11373.html

337 :デフォルトの名無しさん:2014/04/07(月) 11:05:45.64 ID:SBlJ2Fr+.net
ひとつURLにlついてなかったので
http://internet.watch.impress.co.jp/docs/news/20140404_642876.html

338 :デフォルトの名無しさん:2014/04/07(月) 11:50:09.04 ID:ktMnCtsu.net
また、この専用アプリでは、初期状態で「あ」、「い」、「う」、「え」、「お」と割り当てられている5つのボタンに別の文字を割り当てることができたり、この ボタン以外の文字をリアルタイムに選択して、本体のカーボンキーボードで歌わせることも可能とのことです。

発音するノートの直前に文字情報をMIDIシステム・エクスクルーシブで入力する

さらに、すべてをシーケンサ、DAWでコントロールして歌わせたという場合には、MIDIシステムエクスクルーシブを利用して歌詞を設定することも可能 です。具体的には、発音させたいノートデータの直前に

F0 43 79 09 11 0A 00 ** F7

というエクスクルーシブデータを送るのですが、この**に文字番号を設定します。その文字番号についてはポケット・ミクのマニュアルに記載されてい ますが、「み」なら「65」、「く」なら「07」(いずれも16進数表記)のように1バイトの数字が割り振られています。


子音もいけるじゃん

339 :デフォルトの名無しさん:2014/04/07(月) 12:14:36.44 ID:ktMnCtsu.net
なるほど
ようするにmidi音源として見ると安いな
http://m.youtube.com/watch?v=2-v5CB5krws

340 :デフォルトの名無しさん:2014/04/07(月) 13:32:02.94 ID:ktMnCtsu.net
いくつかアイディア思いついたので
ム板らしく早速実装に取り掛かろう
http://m.youtube.com/watch?v=2-v5CB5krws

341 :デフォルトの名無しさん:2014/04/07(月) 13:33:06.19 ID:ktMnCtsu.net
メモ
http://www.nicovideo.jp/watch/sm17357529

342 :デフォルトの名無しさん:2014/04/12(土) 13:52:39.87 ID:UapBJj1i.net
USBでmidiノート投げれば子音も普通にしゃべれるのか

343 :デフォルトの名無しさん:2014/04/13(日) 13:49:25.53 ID:xQQladLb.net
専用スレ立ったのでプログラマ以外の人はこちらでどうぞ

【格安音源】ポケット・ミク【NSX-39】
http://anago.2ch.net/test/read.cgi/dtm/1397341323/

344 :デフォルトの名無しさん:2014/11/04(火) 04:11:37.58 ID:9XcfLbNC.net
画像の処理はよく話題になるが音声の処理はあまり話題にならないな

345 :デフォルトの名無しさん:2014/11/04(火) 04:52:55.25 ID:UYsaPI6O.net
臭いの処理も話題にならないよな

346 :デフォルトの名無しさん:2014/11/06(木) 04:17:54.25 ID:iaZsweTc.net
臭いはまだデバイスがほとんど一般向けに出てないからだろ。
たまにどこぞの大学や企業が試作品作ってるって話が聞こえるくらいだ。

市販されたとしてもプリンタのインクと同じで何かを放出する系だから
維持費がかかって一般人はなかなか買わないだろうね。

347 :デフォルトの名無しさん:2014/11/06(木) 10:29:03.27 ID:keBB2IB1.net
脳に電極を刺してエミュレートする機械の方が先に出るんじゃね

348 :デフォルトの名無しさん:2014/11/06(木) 10:41:01.68 ID:Jg48RgBo.net
味の処理も欲しい・・・です

349 :デフォルトの名無しさん:2014/11/06(木) 12:43:09.93 ID:Uazf0Jll.net
味は、舌に流す電流の波形でどうとか言う話を電通大(本家か大阪か忘れた)の誰かがしてた記憶が

350 :デフォルトの名無しさん:2014/11/06(木) 15:03:14.07 ID:qOkBrttj.net
舌の部位によって担当細胞が分かれてるのが本当だとしたら
電極を当てる場所も点じゃだめで面にしないとな

351 :デフォルトの名無しさん:2014/12/31(水) 08:11:08.67 ID:ve7ao+6B.net
このスレタイほんと好きだわ
このタイトルだけでここまでもったスレと言えよう

352 :デフォルトの名無しさん:2015/02/05(木) 01:04:37.93 ID:K5NTGqg/.net
MMDAgentの2等身のデータどっかにないですか

353 :デフォルトの名無しさん:2015/02/22(日) 14:11:50.22 ID:TfAgRNIZ.net
いつのまにこんな本出てたし
認識じゃなくて合成の方だけど役に立ちそう

イラストで学ぶ 音声認識 2015-01-24
http://www.amazon.co.jp/dp/4061538241

354 :デフォルトの名無しさん:2015/09/04(金) 09:34:58.04 ID:efXmgHpK.net
サウンドプログラミング5
http://peace.2ch.net/test/read.cgi/tech/1231649001/

355 :片山博文MZ ◆T6xkBnTXz7B0 :2015/09/04(金) 20:29:59.47 ID:rFIKIt4e.net
C++とJavaScriptでしゃべるプログラム作らないといけない。俺にもできるかな?

356 :デフォルトの名無しさん:2015/10/30(金) 12:09:18.03 ID:bGTI8z09.net
おk

357 :デフォルトの名無しさん:2015/11/20(金) 17:28:57.26 ID:mFMTXsNS.net
音声素材から1周期分の波形切り出す作業を手動でやりたくないんだがみんなどんな方法でやってるんだろうか
やっぱりフーリエ変換使わないとダメなのかな?
面倒臭そうだから使いたくないんだけど

358 :デフォルトの名無しさん:2015/11/20(金) 18:15:54.49 ID:ipO3g4Qb.net
>>355
SpeechAPI

359 :片山博文MZ ◆T6xkBnTXz7B0 :2015/11/29(日) 12:18:02.04 ID:Xk8n1s0p.net
「FM音源をあやつって正しく音を出したい」
OpenAL+ALUTと、ciscさんのFM音源エミュレータ
「FM Sound Generator」を使って、正しく音を出したい。

https://github.com/katahiromz/fmgengen2/blob/master/sample.cpp
https://github.com/katahiromz/fmgengen2

おかしな音が出ます。たぶんFM音源の使い方が間違っています。
修正方法を教えて下さい。よろしくお願いします。

360 :片山博文MZ ◆T6xkBnTXz7B0 :2015/11/29(日) 14:10:38.11 ID:Xk8n1s0p.net
たすけて

361 :片山博文MZ ◆T6xkBnTXz7B0 :2015/11/29(日) 19:53:25.61 ID:RQ97x6ZU.net
お助けを!

362 :デフォルトの名無しさん:2015/11/29(日) 21:01:39.79 ID:pCZuJ7Kp.net
>>359-361
マルチポストやめようよ

http://peace.2ch.net/test/read.cgi/tech/1181782128/
http://hello.2ch.net/test/read.cgi/i4004/1430836648/
https://teratail.com/questions/21294

363 :デフォルトの名無しさん:2015/11/30(月) 21:29:22.80 ID:xNC+/SUX.net
FM音源ってフーリエ級数じゃない方のやつか

364 :片山博文MZ ◆T6xkBnTXz7B0 :2015/11/30(月) 22:03:02.28 ID:UQmO47jh.net
>>359
私の掲示板に書き込みがあり、この件は解決しました。

365 :デフォルトの名無しさん:2015/11/30(月) 22:55:27.43 ID:a6fnRtX4.net
OpenALもFM Sound Generatorもよくわからんけど
いろいろいじっててやっと解決したと思ったらすでに解決してた…

問題だったのはYM2203クラスのinit()に設定したクロック値が小さすぎたのと
下記みたいにYM2203クラスのcount()の前に音声波形をmix関数で生成しなければ
ならないってことかな

  1.set_pitch、note_on等のイベント
   ↓
  2.mixで必要な時間分だけ波形生成
   ↓
  3.countで内部タイマーを進める(2で波形生成した時間分)
   ↓
  4.以下1〜3の繰り返し

あと、マルチポストして解決したならそれぞれに
解決内容の詳細リンクを張るなりしたほうがいいんじゃないかな?

http://katahiromz.bbs.fc2.com/reply/10466094/34/

366 :片山博文MZ ◆T6xkBnTXz7B0 :2015/11/30(月) 23:19:44.48 ID:UQmO47jh.net
>>365
分かりやすい解説有り難うございます。テラテイル以外の投稿全部に
解決リンクを付けました。テラテイルには明日書き込む予定です。

367 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/04(金) 10:34:43.92 ID:hkRYJkWf.net
https://teratail.com/questions/21704
【FM音源エミュレータをあやつって正しく音を出したい2】

前回(https://teratail.com/questions/21294)の続きです。

OpenAL + ALUTと、ciscさんのFM音源「FM Sound Generator」を
使って、正しく音を出したい。

https://github.com/katahiromz/fmgon/blob/master/soundplayer.cpp
https://github.com/katahiromz/fmgon

フルートの音で、カエルの歌を演奏するプログラムですが、
なぜか音が途切れず、重なってしまい、輪唱みたいになってしまいます。
おそらく、Key-Offが正しく動作していないことが原因と考えられます。
修正方法を教えて下さい。

間違いがあるとすれば、soundplayerかYM2203のどちらかです。

368 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/05(土) 00:11:04.12 ID:oCbOGloR.net
助けて!

369 :デフォルトの名無しさん:2015/12/05(土) 01:29:56.55 ID:mqxGrt9y.net
>>368 コンパイラがエラーを出した@VC2012
soundplayer.h(101) : error C2864: 'VskPhrase::m_goal' : static const int データ メンバー以外をクラス内で初期化することはできません
soundplayer.h(102) : error C2864: 'VskPhrase::m_buffer' : static const int データ メンバー以外をクラス内で初期化することはできません
soundplayer.h(103) : error C2864: 'VskPhrase::m_source' : static const int データ メンバー以外をクラス内で初期化することはできません
soundplayer.h(130) : error C2660: 'std::vector<_Ty>::emplace_back' : 関数に 7 個の引数を指定できません。
ていうか、このスレで良いのかな?

370 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/05(土) 01:31:25.73 ID:oCbOGloR.net
報酬はアマ券15000円なり。ふるってどうぞ。

371 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/05(土) 01:33:37.45 ID:oCbOGloR.net
>>369
IDE古くね? 少なくともC++11コンパイラーぐらいじゃないと

372 :デフォルトの名無しさん:2015/12/05(土) 09:20:41.26 ID:+JNdeu9m.net
>>371
なら先にそう書いとけ
オリジナル版が2003年?なのに何ですっ飛んでるんだw

373 :デフォルトの名無しさん:2015/12/05(土) 17:07:48.22 ID:fBRM/5tN.net
>>371
>>359からYM2203クラスに変更を加えてないならおそらくYM2203は大丈夫
あとは気が向いたら調査する。

プログラムとは関係ないけど音色のパラメーターは大丈夫?
音色のリリースタイムが長い場合、音がなかなか切れずに言ってるような現象になるかも。

それから人に聞くなら情報を的確に。

374 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/05(土) 18:00:03.86 ID:oCbOGloR.net
>>373
フルートの音色が選択されているが、これはCMD VOICE COPYで取得したのと
同一であることを確認した。だから音色のパラメーターは間違っていない。
間違ってるとすれば他のパラメーターかもしれない。
YM2203については、YM2203のnote_on,note_offメソッドをkey_on,key_offに改名した以外は
大きな変更はない。

375 :デフォルトの名無しさん:2015/12/05(土) 20:38:36.12 ID:fBRM/5tN.net
>>374
簡単な切り分けを

main関数 317〜356行目をコメントアウトして
Cの音のみ(「phrase->add_note('C');」のみ)を鳴らすようにしたらどうなる?

音が鳴り続ける?鳴っては止まって鳴っては止まってを繰り返す?

それからVskPhrase::realize関数内で確保してる配列dataは0で初期化しなくて大丈夫?

376 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/05(土) 22:20:36.98 ID:oCbOGloR.net
>>375
有り難う。mixの直前にmemsetを追加すると音が切れるようになった。
報酬が欲しければメールで連絡してくれ。
CLOCKは4000000のようだ。LFOはまだ働いていない。

377 :デフォルトの名無しさん:2015/12/05(土) 22:58:24.14 ID:fBRM/5tN.net
メールで連絡って偽物だったらどうするの…?

報酬はいらんから少しマナーをわきまえてね
学生の頃 Cの勉強でお世話になったのにちょっと幻滅

378 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/05(土) 22:58:24.57 ID:oCbOGloR.net
LFOとwaveformのレジスタがわからん。

379 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/06(日) 13:56:32.76 ID:7Za5T0R3.net
FM音源のLFO設定がわからない
http://teratail.com/questions/21704

OpenAL + ALUTと、ciscさんのFM音源「FM Sound Generator」を使って、
自作のBASIC環境用の音を実現しようとしています。
http://github.com/katahiromz/fmgon/blob/master/soundplayer.cpp
http://github.com/katahiromz/fmgon
UFOが遠ざかる音色(@16)で、カエルの歌を演奏するプログラムですが、
LFOが設定されていないので、音にひずむようなエコーがかかっていません。
音源に対してこの音色のLFOを設定する方法を教えて下さい。

380 :デフォルトの名無しさん:2015/12/06(日) 14:37:08.73 ID:4/ehRKm1.net
FM Sound Generatorの使い方なら最初の質問みたいに作者に聞けば?

381 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/06(日) 14:41:48.80 ID:oZIU0x1K.net
>>380
作者から返事が来ない(泣

382 :デフォルトの名無しさん:2015/12/06(日) 18:45:17.06 ID:08bZjbf4.net
実機でもエミュレータでもいいから「正解の音」を録音してどこかに置いておけば
より多くの人から返事をもらえる可能性があるかもしれないなあ、と思ったよ。(ひとりごと)

383 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/07(月) 13:21:15.04 ID:vUUH5oSb.net
>>382
ファイル名:cmd_voice.zip
パスワード:passpass
http://drive.google.com/uc?export=view&id=0B3nA8ShVAS4OOEFTUWZGN3RtU3M

384 :デフォルトの名無しさん:2015/12/07(月) 15:47:38.89 ID:KuRdWB2c.net
パフパフニャーニャー
パフパフニャーニャー

385 :デフォルトの名無しさん:2015/12/07(月) 22:39:51.16 ID:yUJmRPdi.net
R11からR13

386 :片山博文MZ ◆T6xkBnTXz7B0 :2015/12/09(水) 00:38:04.46 ID:1u+HKFL5.net
>>385
詳しくお願いします。

387 :デフォルトの名無しさん:2016/02/21(日) 16:56:45.60 ID:8kkxo0DR.net
ホス

388 :デフォルトの名無しさん:2016/03/29(火) 08:42:58.29 ID:/c8bAcK4.net
サッカーブッシュ日本代表日程ぷあたん(しゅっちょうまいくろ教育長交代)春文執行40代売上差額シュガーチョコ
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ24チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン(販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費 おじや50代資産ガリバズフィード40代エリート

389 :片山博文MZ ◆T6xkBnTXz7B0 :2016/04/08(金) 19:07:37.41 ID:eaIwZ6It.net
https://github.com/katahiromz/WinVoice

アンパンマン、新しい顔ができたよ!

390 :デフォルトの名無しさん:2016/05/30(月) 14:58:42.21 ID:lmnfFsu1.net
概出だったらすまそ
https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=text_to_speech&p_name=api_usage_scenario

総レス数 390
81 KB
掲示板に戻る 全部 前100 次100 最新50
read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★