２ちゃんねる ■掲示板に戻る■ 全部 1- 最新50

■ このスレッドは過去ログ倉庫に格納されています

音声合成プログラムを作りる

1 ：デフォルトの名無しさん：2007/06/14(木) 09:48:48 .net: ネトラジとかで声優のしゃべた音声がたくさん出回ってきたから、
それを使って音声合成するプログラムを作りたいと思うんだけど、
そんなスレ
2 ：デフォルトの名無しさん：2007/06/14(木) 09:52:04 .net: じゃあ、一緒に作るれ
3 ：デフォルトの名無しさん：2007/06/14(木) 09:54:14 .net: しゃべた
4 ：デフォルトの名無しさん：2007/06/14(木) 10:08:17 .net: ネトラジリソース多いのんって誰かな
ＢＧＭとかあんまなくって、高音質なの
5 ：デフォルトの名無しさん：2007/06/14(木) 10:33:17 .net: よし、みんなで作れろ
6 ：デフォルトの名無しさん：2007/06/14(木) 12:27:51 .net: 中原小麦が多いるれ
7 ：デフォルトの名無しさん：2007/06/14(木) 14:18:18 .net: 音声合成は難しいぜ
しかもそんだけの素材じゃかなり苦労する

と元国立理系大学院音声関係研究者の俺が言っておく。
8 ：デフォルトの名無しさん：2007/06/14(木) 14:39:22 .net: 音声を発するシミュレーションを
まじめにやったらどうなるんだろう。
骨格、肉、声帯、云々。
9 ：7：2007/06/14(木) 14:57:22 .net: シミュレーションやるより、模型？を作った方が楽なんだなー
10 ：デフォルトの名無しさん：2007/06/14(木) 14:58:35 .net: でも、模型はメンテナンスが
11 ：デフォルトの名無しさん：2007/06/14(木) 16:22:28 .net: >>7 に期待
12 ：7：2007/06/14(木) 20:44:39 .net: いや、俺の元専門は音声認識だから・・・
そんな俺でも「声優の声」を目指す>>1は厳しい、ということくらいはわかる。

ニュースとかで見聞きする合成音声ってみな糞でしょ？
何年も進化していないのよ。

音素切り貼り(新聞の切り抜き文字で文章作る感じ)、なら多少はいける・・・かもしれないけどね。
13 ：デフォルトの名無しさん：2007/06/14(木) 21:11:40 .net: 　　　　　 |
　　＼　　__　　／
　　＿　（ｍ）　＿ﾋﾟｺｰﾝ
　　　　　|ミ|
　　／　｀´　＼
　　　　　('A`)　　　　　そうだ！　自分で喋ればいいんだ！
　　　　　ノヽノヽ
　　　　　　　くく
14 ：デフォルトの名無しさん：2007/06/15(金) 00:03:29 .net: >>1が作るって言うんだから、余計な口出しはせず、
まずはお手並みを拝見する所だろう。
15 ：1：2007/06/15(金) 01:58:54 .net: まずは音声データベース作んないと
なんで、ネトラジ落としてWAVにして文章ごとに分割してみた
こんどは、音素ごとに区切る作業はじめる
専用のツールつくんないとだめかな
16 ：7：2007/06/15(金) 02:42:52 .net: ツールならHTKにいいのがあるんじゃね？

音声認識機に通して音素ごとに切り分ける、ってのが大量データ作成には楽かな？
しかし懐かしすぎ・・・
17 ：1：2007/06/15(金) 02:48:21 .net: >>16
HTKおｋ、しらべる
ｔｈｘ
18 ：デフォルトの名無しさん：2007/06/15(金) 16:35:47 .net: 垚
19 ：デフォルトの名無しさん：2007/06/16(土) 16:15:14 .net: 1さんに期待

しかし, カクカクとした音声が限界じゃないかね
声優のような音にするにはパラ情報なんかの
感情を表現する部分をどの程度対応できるかに
よると思われ

とか, ネットワーク屋さんのもれが曰ってみる
20 ：1：2007/06/17(日) 14:53:48 .net: ＨＴＫ登録したのにパスワード送てこねー
説明書くらい登録なしで読ませてもいいのにさ
待てる間に音声ｄｂ作成支援ツールでも作りる

ところで音声認識の分割精度てどれくらい出んの？
０から書き起こしさせるのは全然使えねーレベルなんは分かるけど、
書き起こしテキストあれば音素位置そろえるくらいは精度いいんかな
21 ：デフォルトの名無しさん：2007/06/19(火) 02:06:23 .net: http://plusd.itmedia.co.jp/lifestyle/articles/0405/28/ts_virtual_morita.mpg
86時間コーパス。これくらいでよろ！
22 ：1：2007/06/20(水) 03:00:36 .net: 86時間て正味？ネトラジから集めよう思たら数年分必要だなー
ところでこれＮＨＫの森田アナだよね
ところどころイントネーション変な繋がりあるから
数文節単位くらいで切り貼りしてるん？
23 ：デフォルトの名無しさん：2007/07/08(日) 20:38:20 .net: http://pc11.2ch.net/test/read.cgi/software/1119069271/
24 ：デフォルトの名無しさん：2007/07/10(火) 17:10:43 .net: 理系大学院って工学部と理学部でだいぶ違うよな
25 ：1：2007/07/10(火) 23:29:09 .net: >>23
さんくすです
SoftalkはAeuqst社のAquesTalkを音声合成エンジンとして使っている、
web2speechは大学が作ったGalateaTalkをエンジンとして使っている、
EasySpeechはSAPI使ってエンジンを読んでるだけみたいでしね
自分で音声合成エンジン作ってる人はまだないのかな
26 ：デフォルトの名無しさん：2007/07/13(金) 14:22:49 .net: age
27 ：デフォルトの名無しさん：2007/07/13(金) 14:27:35 .net: age
28 ：デフォルトの名無しさん：2007/07/13(金) 14:29:44 .net: age
29 ：デフォルトの名無しさん：2007/07/13(金) 14:40:43 .net: ttp://www.sp.nitech.ac.jp/~demo/gtalk/demo.php
30 ：デフォルトの名無しさん：2007/07/13(金) 18:29:39 .net: 同じ金額で声優雇った方が早くね？
31 ：1：2007/07/14(土) 00:03:56 .net: >>30
別にセリフ読んでもらいたいわけじゃないし
合成音声で２ちゃんログとかメールとか
読んでもらったら面白くなくね？
32 ：デフォルトの名無しさん：2007/07/19(木) 21:26:09 .net: 音（声）の切り張りと云うと、コナミがときメモ3でやってなかったっけ？
未プレイ（体験版触っただけ）だから、詳しくは解らんけど。
33 ：名無しさん＠そうだ選挙に行こう：2007/07/29(日) 04:01:34 .net: イントネーションを網羅した辞書みたいなファイルを作って
文章をAquesTalk用の音声記号列に自動変換するようにすれば、
どんな文章もきれいに読み上げることができそう。
34 ：1：2007/07/30(月) 00:14:46 .net: >>32
ときめも２と３でプレーヤの名前を呼んでくれる
ＥＶＳという音声合成システムがのてたみたい
やったことないからクオリティーは分からないよ
ttp://ja.wikipedia.org/wiki/%E3%81%A8%E3%81%8D%E3%82%81%E3%81%8D%E3%83%A1%E3%83%A2%E3%83%AA%E3%82%A2%E3%83%AB2
ttp://www.konami.jp/gs/game/toki3/point/game/evs2.html
35 ：1：2007/07/30(月) 00:22:44 .net: "音声合成ゲーム"で検索すると
ＰＳ２　モジブリボンにＮＴＴ
ＰＳ２　ダビつく３に東芝
ＤＳ　お料理ナビは？
ＤＳ　日本史・世界史に日立
なんてのが見つかったよ
どうなん？
36 ：1：2007/07/30(月) 00:26:22 .net: >>33
イントネーションって網羅できるもんなの？
ＡｑｕｅｓＴａｌｋってあんまりきれいな声とは思えない
37 ：デフォルトの名無しさん：2007/07/31(火) 01:27:57 .net: 以前でてた音声コーパスっていうのがそういうものじゃないのか？
38 ：デフォルトの名無しさん：2007/07/31(火) 04:55:00 .net: 同じ単語でもどう使われるかでイントネーションって変わるからな。
39 ：デフォルトの名無しさん：2007/08/01(水) 00:48:55 .net: >>38
例えば？
40 ：デフォルトの名無しさん：2007/08/06(月) 10:44:13 .net: 彼氏↑、彼氏↓
41 ：デフォルトの名無しさん：2007/08/06(月) 16:39:36 .net: 箸　端　橋　嘴　波子　梯
頑張って聞き分けてください。
42 ：デフォルトの名無しさん：2007/08/06(月) 17:10:09 .net: 無理ッス絶対無理ッス自分無理ッス
43 ：デフォルトの名無しさん：2007/08/06(月) 20:17:36 .net: >>41
それは「同じ単語」でイントネーションが「変わる」例になってないだろ。
44 ：デフォルトの名無しさん：2007/08/06(月) 20:32:17 .net: どうして>>1は舌っ足らずなんだろう。
ていうか>>6のせいで、
このスレの全てのレスが桃井声で脳内再生されるんだがw
45 ：デフォルトの名無しさん：2007/08/06(月) 20:33:20 .net: >>35
くまうたも忘れないでくれ
46 ：デフォルトの名無しさん：2007/08/08(水) 01:18:40 .net: 早く作りろ
47 ：デフォルトの名無しさん：2007/08/08(水) 01:58:32 .net: 「あ」の波形と「い」の波形を足して２で割ったら、「あ」と「い」の中間の声ができるってわけか！
48 ：デフォルトの名無しさん：2007/08/08(水) 01:59:27 .net: ようするに、声帯をプログラムでシミュレートすればいいんだろ
簡単ジャン
49 ：デフォルトの名無しさん：2007/08/08(水) 02:11:22 .net: じゃ期限は明日の０時だ。よろしく。
50 ：デフォルトの名無しさん：2007/08/08(水) 04:15:54 .net: オーケーベイビー
首洗って待ってな。
51 ：デフォルトの名無しさん：2007/08/09(木) 01:17:32 .net: まだぁー？
もう全身洗って待ってるんだけど。
52 ：デフォルトの名無しさん：2007/08/09(木) 06:52:26 .net: 声帯って振動するだけ？声によって（高さじゃなく「あ」とか「い」）振動の仕方が異なることはないよね？
音が高くなると振動数が増えるだけだよね？
声帯が発した振動を口の形と舌でコントロールすると「あ」とか「い」になるという解釈でいいの？
舌のシミュレーションが大変そう(><;)
53 ：デフォルトの名無しさん：2007/08/09(木) 10:39:18 .net: 音声学の勉強からやらなきゃダメだね。
昔勉強したけど、もう忘れたからお役に立てないよ、ごめん。
54 ：デフォルトの名無しさん：2007/08/10(金) 14:06:39 .net: 必要な音素が全て含まれた文章を作って読んで、それから音素を抽出するようにすれば、そのうち望んだような声質の人が音を提供してくれることもあるんじゃないかと思るれ
55 ：1：2007/08/10(金) 16:14:15 .net: >>54
誰の声でもいいんだったら、それでもいんだけど、
やっぱ声優の誰々の声でってのが大事だから、
今はネトラジの音声からちまちま集めてるよ
56 ：デフォルトの名無しさん：2007/08/11(土) 18:40:21 .net: どっちかっつーと話者変換のほうに興味があるんだが
57 ：デフォルトの名無しさん：2007/08/16(木) 22:59:34 .net: その声優の音声ファイルはSNいいのか？
58 ：1：2007/08/16(木) 23:48:39 .net: >>56
話者変換って何に使うん？
自分のしゃべった声を誰かの声に似せるとかな？
59 ：1：2007/08/17(金) 00:13:19 .net: >>57
ＳＮは分かんねが、音は良さげ（６４ｋｂｐｓの４４ｋＨｚ）
一人しゃべりでＢＧＭなしなんじょ
60 ：デフォルトの名無しさん：2007/08/17(金) 01:07:05 .net: BGMなしか。それはいいな。
とりあえずHTKでその声優の音響モデルつくるところからだべ。
61 ：デフォルトの名無しさん：2007/08/17(金) 20:59:04 .net: 俺は女性のツテなしで自分ひとりでもマルチヒロイン声つき同人エロゲーを作れる環境が欲しい
62 ：デフォルトの名無しさん：2007/08/24(金) 21:36:59 .net: エロゲの音声使えば？
抜き出し出来れば、台詞も大量にあるし、テキストもあるので分割解析もしやすいしょ
63 ：デフォルトの名無しさん：2007/08/28(火) 07:41:37 .net: 北都さんの声でお願いします
64 ：デフォルトの名無しさん：2007/09/06(木) 14:16:39 .net: 結構凄いけど、まだ今一歩というところか。結構おしいところまでは行ってるな。
http://www.nicovideo.jp/tag/%E5%88%9D%E9%9F%B3%E3%83%9F%E3%82%AF
65 ：デフォルトの名無しさん：2007/09/06(木) 20:14:37 .net: >>64
藤田咲はまなストのモモ役が良かったなぁ
66 ：デフォルトの名無しさん：2007/09/21(金) 10:48:08 .net: ときめも２以降で採用された音声のプログラムってどんなアルゴリズムなのか分かる人教えて
67 ：デフォルトの名無しさん：2007/12/17(月) 22:51:47 .net: >>66
overlap add
68 ：デフォルトの名無しさん：2007/12/19(水) 12:23:36 .net: ――
学校

￣￣￣＼
専門学校
69 ：デフォルトの名無しさん：2007/12/20(木) 23:14:24 .net: >>67
ありがと。調べてみる。
ついでに初学者の入門書みたいなのがあったら教えてくれると嬉しい
70 ：デフォルトの名無しさん：2007/12/21(金) 01:38:07 .net: Alice Project
71 ：デフォルトの名無しさん：2007/12/24(月) 09:25:18 .net: 2007/12/19(Wed.) ◆ Julius-4.0 リリース
72 ：デフォルトの名無しさん：2007/12/29(土) 18:28:29 .net: 初音ミクが話題にならないあたり、ここはプログラム板じゃないのかと思ってしまう。

そんな、俺に、お勧めはこれ。

「エロ版初音ミク」の衝撃 - 「阿久女イク」を使ってみた - 偏読日記@はてな
http://d.hatena.ne.jp/a-park/20071227/p1
73 ：デフォルトの名無しさん：2007/12/30(日) 12:03:36 .net: 音声合成というより、台詞合成だな
74 ：デフォルトの名無しさん：2007/12/30(日) 13:55:26 .net: >>72
ワロタ
75 ：デフォルトの名無しさん：2008/01/06(日) 13:05:04 .net: れこーどうえーぶ
http://recwav.dip.jp/

音声でメッセージを伝えよう
http://recwav.dip.jp/M_RECWAV_Media.asp?Speech=1221925210420080106131222
76 ：デフォルトの名無しさん：2008/01/10(木) 21:52:09 .net: この板の住人じゃないんだけどＡｑｕｅｓＴａｌｋでwav保存できるソフト
あるのかな？
DTM板住人なんだけど、需要ありそうだったから。
俺自身もあったら使いたい。
オーディオアウトとインをつなげばできるけど、
そんなの嫌だしｗ
77 ：デフォルトの名無しさん：2008/01/11(金) 06:44:14 .net: 全二十じゃないの？
78 ：デフォルトの名無しさん：2008/01/11(金) 13:26:54 .net: 全二十が全二重と気づくまでに数時間を要してしまった・・・orz
要するにサウンドキャプチャソフト使えば？ということかな？
まぁ実際に配線するより数倍マシだから、それで納得するしかないか。
79 ：デフォルトの名無しさん：2008/01/13(日) 09:32:40 .net: 普通に、ライン出力を録画するんではダメなのか？
80 ：デフォルトの名無しさん：2008/01/18(金) 02:45:43 .net: >>78
スマンスマンｗ
二十って書いたの俺かもｗ
81 ：デフォルトの名無しさん：2008/01/19(土) 00:36:30 .net: >>76
API見たら、普通にAquesTalk_Synthe()を呼べば保存できそうだけど、
そういうことじゃないのか？
ほとんどの人がライセンスがないから試せないと思われ。
82 ：デフォルトの名無しさん：2008/01/26(土) 02:02:50 .net: >>76
俺はここ数か月DTM板に出入りするようになった者だけど
オーディオインとアウトをつなぐって言っても
ハード的に結線するんじゃなくて
DAWのRECボタン押下→AquesTalk再生みたいな感じで
とりあえず録音はうまくいくけど
音質まではわからない
83 ：デフォルトの名無しさん：2008/01/26(土) 02:53:10 .net: 全二重に温室関係案のカナ？
84 ：デフォルトの名無しさん：2008/02/07(木) 12:56:18 .net: いまどこまで進んでいるんだ？
85 ：デフォルトの名無しさん：2008/03/24(月) 13:24:15 .net: age
86 ：デフォルトの名無しさん：2008/04/06(日) 12:19:17 .net: >>1
おーい！いまどこまで進んでいるんだ？
87 ：デフォルトの名無しさん：2008/04/07(月) 01:29:34 .net: age
88 ：デフォルトの名無しさん：2008/04/07(月) 04:01:19 .net: 「あ」の波形と「う」の波形を足して２で割ったら「い」の波形ができるのを発見して特許取った
89 ：デフォルトの名無しさん：2008/04/07(月) 08:54:58 .net: 特許番号は？
90 ：デフォルトの名無しさん：2008/04/07(月) 21:51:13 .net: どのくらい「い」と区別が付かないんだ？
不自然感０？
91 ：デフォルトの名無しさん：2008/04/07(月) 21:54:23 .net: じゃあ俺は「い」の波形を倍にして「あ」の波形を引いたら
「う」の波形が出来るという特許を取ろうかしらん
92 ：デフォルトの名無しさん：2008/04/23(水) 18:22:12 .net: >>88-91
もうちょっとでアヘ声が実現するな
93 ：デフォルトの名無しさん：2008/04/29(火) 23:32:40 .net: >>88　特許番号は？
94 ：デフォルトの名無しさん：2008/05/01(木) 14:02:57 .net: juliusで音素列を指定して、
強制アライメント取れますか？
95 ：デフォルトの名無しさん：2008/05/02(金) 23:24:08 .net: >>94
つ単語・音素セグメンテーションキット＆Julian
96 ：94：2008/05/07(水) 03:45:12 .net: >>95
ありがと
juliusでディクテーションさせて、julianで強制アライメントできるようになりました。
ところで、ピッチを求めるいいアルゴリズムはありませんか？
97 ：デフォルトの名無しさん：2008/05/14(水) 13:20:18 .net: Ｃ＋＋ＭＩＤＩプログラミングっていう廃刊を店に売ろうか悩んでるんだけどいくらになるんだろう
98 ：デフォルトの名無しさん：2008/05/17(土) 07:29:42 .net: ヤフオクの方が売れるんじゃね？
99 ：94：2008/05/19(月) 00:47:59 .net: とりあえず、声優のラジオ番組の音声分割して、接続合成できるプログラム作ってみました
juliusの認識精度ではダメですね、手修正必須ですが
100 ：デフォルトの名無しさん：2008/05/19(月) 08:53:12 .net: そうか
音声素材なんてわざわざ録音しないでも
ネットラジオにいくらでも転がってるんだな
面白い発想するな
101 ：デフォルトの名無しさん：2008/05/19(月) 22:39:48 .net: これは意外な盲点。
個人(？)で使う分には十分だね。
102 ：デフォルトの名無しさん：2008/05/20(火) 12:01:59 .net: >>99
サンプルを聞いてみたいです
103 ：デフォルトの名無しさん：2008/05/20(火) 19:25:05 .net: 周波数と最初に名づけたやつは死んでいいと思うな
104 ：94：2008/05/24(土) 11:02:31 .net: >>102
音ってどこにアップできます？
それと何話させましょ？
声優はＳＭです
105 ：102：2008/05/24(土) 13:14:10 .net: >>104
アップローダは↓でお願いします。
ttp://www.axfc.net/uploader/

セリフは↓のサンプル音声の「シナリオ」あたりでどうでしょう。
ttp://voice.pentax.jp/blog/64.html
106 ：デフォルトの名無しさん：2008/05/24(土) 15:20:08 .net: ttp://www.aoni.co.jp/actress/ma/voice/minaguchi-yuko.mp3
これで
107 ：94：2008/05/25(日) 10:00:48 .net: >>105,106
ttp://www11.axfc.net/uploader/20/so/He_103620.lzh
kwdは94です
108 ：102：2008/05/25(日) 11:08:17 .net: >>107
サンプル拝聴しました。
音素や単音単位ではなく、単語単位の連結なんですね。
語のつながりがぶつ切りで、聞き取るにはちょっと辛いかなと思います。
音素単位なら、聞き取りやすくなるかもしれませんが、
抑揚やアクセントを指定できるようにしないといけないので、難しいですが。
109 ：94：2008/05/25(日) 22:57:56 .net: >>108
アドバイスありがとうございます。
使えるだけ使うので、単語より長い部分も１音素だけの部分もあります。
今はピッチ情報がないので抑揚をそろえられないです。だから最長一致。
これからはピッチをそろえられるようにしてみます。
110 ：デフォルトの名無しさん：2008/07/12(土) 13:27:35 .net: >>109
これってオープンソースにしないの？
111 ：デフォルトの名無しさん：2008/07/13(日) 13:49:42 .net: >>109
94さん

>>110の追加なんですがオープンソース化のメリットは・・・

開発が止まっても後を継げる。

・例えば作者が飽きたとか、あるいは交通事故にあったとかで開発が止まったとする。
　そんな場合、誰かが開発を引き継いでくれる可能性がある。

誰かが他のOSに移植してくれる。

・誰かがMacOS版を作りたいと思ったときに、ソースコードを見ずに移植した場合、どうして
　も互換性に問題が出る。
　しかし、ソースが公開されていれば、少ない手間でほぼ完全な移植ができる。
　環境に依存した部分は書き直したり、移植が難しい部分については機能を削ったりする
　必要があるけど、それでも一から書くよりはずっと楽。
　ちなみに、現在Windows以外の環境でサポート外の動いている場合、
　それは誰かが更新履歴の仕様を見て、オリジナルのコードを使わずに
　クラックして移植したものだ。ありがたいことだけど、
　もしソースが公開されていたらこの作業は不要だったはずで、その人はもっと別の作業ができた。

バグを修正できる
・誰かがバグを見つけ、それを報告したとする。
　それをみた第三者かが、ソースコードの中から原因を見つけて、
　作者に「ここを直せばいいぞ」と教えてくれる可能性がある。
　ひょっとしたら修正したソースコードをupしてくれるかもしれない。
112 ：111：2008/07/13(日) 13:52:00 .net: >>111　続き
自分で改良して、それを作者に提案できる。
・第三者ソフトウェアを見て「ここを改良したらもっと良くなるんじゃないのか？」
　もしくは「こんな機能を追加したらもっとよくなるんじゃないの？と誰かが思ったとする。
　その場合、公開されているコードを改良・追加し、作者に改良案や機能追加案を提案する
　ことができる。
　作者がその人の方がより開発に向いていると判断した人は、作者の許可を得て改良版を
　公開することができる。
　第三者が改良案や機能追加案を提案して作者がそれを見て、影響を受けて、第三者の
　改良版を使用しながら作者は更なる改良を加えることができる。
　ソースが公開されていなかったら、作者に具体的に改良案や機能追加案を
　提案することが難しい。

HDDが飛んでも即死しない
・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
　　ソースがサーバ上にアップしていれば、作者のHDDが飛んでも、開発を続行することが
　　できる。

とこんな感じなメリットがあります。
長文になってすいません。　ぜひご検討のほうよろしくお願いします。
113 ：デフォルトの名無しさん：2008/07/13(日) 22:37:30 .net: でたーオプソ厨
114 ：デフォルトの名無しさん：2008/07/14(月) 12:10:04 .net: >>110
>>111
>>112

それはいいアイディアですね。　ぜひやってもらいたいです。
115 ：デフォルトの名無しさん：2008/07/14(月) 12:14:13 .net: 反論するのも馬鹿馬鹿しいが。
＞・「作者のHDDが飛んだので開発中止」っていうソフトたまにあるよね……あれはむなしい。
これを字義通りに受け取る(或いはそのように敢えて振舞う)人がいることに驚いた。
116 ：デフォルトの名無しさん：2008/07/14(月) 22:51:41 .net: 俺が学生時代にちまちま作ってたしょぼいソフトは
まさしくその運命をたどったよ
117 ：デフォルトの名無しさん：2008/07/15(火) 01:33:45 .net: そういや昔のプログラムはフロッピーに入れてたのでもう見れなくなったなｗ
118 ：デフォルトの名無しさん：2008/07/15(火) 03:56:00 .net: 実はハードごとまだ生きてる
子供の頃しこしこ打ち込んでた雑誌掲載のBASICゲームは起動メニューを作っておいたので
ファイル名すら覚えてなくても今でも遊べる
子供時代の自分の聡明さにしばし感動
今はもう駄目かもわからんね
119 ：デフォルトの名無しさん：2008/07/15(火) 21:05:07 .net: そこで FILES
120 ：デフォルトの名無しさん：2008/07/19(土) 12:36:03 .net: >>109
おーい。94氏　オープンソース化しないのかい？
返事をくれ。
121 ：デフォルトの名無しさん：2008/07/19(土) 13:34:24 .net: 自分の要求のために他者に負担をかけることを当然のように考えてるからオプソ「厨」って付くんだな。
122 ：デフォルトの名無しさん：2008/07/19(土) 13:55:25 .net: 某コナンの蝶ネクタイ型変声機みたいな物は作れないかなぁ
他人の声からパラメータだけ抽出して、云々
123 ：デフォルトの名無しさん：2008/07/19(土) 14:16:39 .net: 既にあるんですね...
124 ：デフォルトの名無しさん：2008/07/19(土) 17:00:43 .net: オプソ厨って、自作自演だよｗ
シェア作家のなｗ
125 ：デフォルトの名無しさん：2008/07/20(日) 10:50:58 .net: >>124
そんなわけないだろうｗ
126 ：94：2008/07/20(日) 12:22:06 .net: 久々に見に来たらレス増えてた。。。
オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ？
素材の音声データが無いと。それもかなりの量で。。
127 ：デフォルトの名無しさん：2008/07/20(日) 14:54:58 .net: プログラムの権利より音声データの権利のほうが問題になりがち
128 ：デフォルトの名無しさん：2008/07/20(日) 15:05:16 .net: >>122
1.マイクの声から声帯の影響を取り除く
2.フォルマントを他人の位置に移動する
でできるかも
129 ：デフォルトの名無しさん：2008/07/20(日) 23:56:23 .net: >>126
>オープンソースにするのはいいんですけど、プログラムだけだと何もできませんよ？

それでもいいと思う。

自分の声のデータを入れて合成することもできるし。

オープンソースなら合成エンジンをもっと高性能化することもできるし。

使う側が改造できるだけでなく、作った側にも自分の技術を高める、新しい着想を得る

といった双方にメリットがあるかもしれませんし。
130 ：デフォルトの名無しさん：2008/07/21(月) 01:03:03 .net: >>129
オープンソースって勝手に改変してくれる分にはいいけどパッチとか
送ってこられるとうざくない？
正直ソースが穢れるけど、拒否するとアンチ化しそうだし。
131 ：デフォルトの名無しさん：2008/07/21(月) 02:24:44 .net: そりゃ、コミュニケーション力がないだけだな。
適当にあしらえばいいし、ソースは参考になるなら自分で書き直して入れましたでいい。

オープンソースと、みんなで開発はまた別だよ。
132 ：デフォルトの名無しさん：2008/07/21(月) 02:29:45 .net: すべての会話音声を録音して流せば解決
133 ：デフォルトの名無しさん：2008/07/21(月) 11:45:45 .net: >>109
>>94氏
このプログラムは「Alice Project」と同じようなことができるのかい？

又某コナンの蝶ネクタイ型変声機みたいな機能を追加する予定とかはあるのかい？
134 ：デフォルトの名無しさん：2008/07/21(月) 20:30:25 .net: >>131
参考になるものは送ってこないから。
これだけは断言できる。
勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
しつこくしてくるのが関の山。
いやほんとしつこくされるよ。
住所なんか当たり前のように調べてくるしね。
それなりの覚悟がないとオープンソースは無理だよ。
135 ：デフォルトの名無しさん：2008/07/21(月) 21:18:17 .net: どうでもいいがペンタックスの合成ライブラリはかなり巧い
136 ：デフォルトの名無しさん：2008/07/21(月) 22:28:41 .net: >>134
そんなわけねえだろうよｗ
確かに参考になるものは送られてこないのは確かだけど、しつこくは
されないだろう。

しかもメールアドレスを公開しないでオープンソース化すればいいだけの話。
137 ：デフォルトの名無しさん：2008/07/21(月) 22:32:25 .net: オープンソース化ってもごく一部のソフト以外はパッチが送られてくるどころか読まれることすらほとんどなさそーな悪寒。
138 ：デフォルトの名無しさん：2008/07/21(月) 23:19:57 .net: てか、ソース見せ合うだけなら
どっかに無料のうｐロダ用意してそこに勝手にソースをうｐしたり、落としたりすれば良いんでは？
139 ：デフォルトの名無しさん：2008/07/22(火) 00:15:42 .net: 反オプソ厨は、言い訳が稚拙なのがなｗ

普通に、手柄を独り占めしたい、ソースを見せたくない、でいいんだよｗ
140 ：デフォルトの名無しさん：2008/07/22(火) 00:48:55 .net: >>136
じゃぁそうしてみろよ。
どっかのロダに匿名で上げて見れ。
おれの創作物を勝手にオープンソースにしやがったってやつが3人は
出てくるから。
そうすればオープンソース厨の怖さが少しは理解できるだろ。
奴らは（無料も含めた）金のためなら何でもするからな。
141 ：デフォルトの名無しさん：2008/07/22(火) 01:16:48 .net: >>139
バカなオプソ厨を装った釣りとかネタか？
作った人間が手柄を独り占めできるのは当然の権利で言い訳とかいらんだろ？
むしろオプソ厨のほうが「あなたの手柄をタダ取りしたいんでソース見せてください」ってのを
いかにオブラートにくるんでうまく言えるか工夫しなきゃいけない立場なのに。
142 ：デフォルトの名無しさん：2008/07/22(火) 01:24:19 .net: >>141
だったら言い訳しなくていいよｗ　言い訳するってのは、何らかの心の働きだから。
いちいち、オプソ厨がウザイとか、ソースが汚いから見せるのが嫌だとか、しょうもない言い訳はいらんから。

まぁ、他の人のソースパクってて本当に見せられない奴も中にはいるだろうけどｗ
143 ：デフォルトの名無しさん：2008/07/22(火) 01:37:40 .net: >>142
え？マジなの？本当はオプソ厨のふりしたネガキャンだよな？
144 ：デフォルトの名無しさん：2008/07/22(火) 23:53:47 .net: >>140
だったらGPLもしくはGNU等のライセンスで公開すれば？
ちなみに、俺もオープンソースで公開したんたが、そんなことはなかったと思うな。
145 ：デフォルトの名無しさん：2008/07/23(水) 00:00:43 .net: 誰か再うpしてくれないか
間違えて削除してしまった
146 ：デフォルトの名無しさん：2008/07/23(水) 00:23:13 .net: >>144
匿名でGPL等でうぷした場合の話だろ。
おまえは都合の悪い話は一切読めないのか？

クレクレ言ってる時点でオプソ厨のニオイがプンプンしてるんだよ。

匿名じゃない場合は過去ログ参照。
147 ：デフォルトの名無しさん：2008/07/23(水) 01:01:07 .net: こういう流れを作ってグダグダにするのがオプソ厨の狙いなんだから相手するなよｗ
148 ：デフォルトの名無しさん：2008/07/23(水) 03:23:34 .net: 嫌なら嫌だって言えば良いだけだしな。
つーか、厨はクローズドの方がよってくると思うがｗ
あれしてくれ、これしてくれってｗ

オープンソース・フリーソフトなら、自分でやれ！で終わるｗ
149 ：デフォルトの名無しさん：2008/07/23(水) 08:28:05 .net: もし公開するならある程度完成度をあげてからの方がいいよ。オリジナルは俺だと主張できるくらいにね。
中途半端なソースを公開する必要なんて無い。
150 ：デフォルトの名無しさん：2008/07/23(水) 13:10:13 .net: 実際の声からサンプリングするんじゃなくて、人間の声帯を物理モデリングして作れよ。
151 ：デフォルトの名無しさん：2008/07/23(水) 16:14:23 .net: 式うｐしてくれ
152 ：デフォルトの名無しさん：2008/07/24(木) 02:26:56 .net: まずは模型を作るところから始めるんだ
153 ：デフォルトの名無しさん：2008/07/25(金) 16:16:30 .net: >>146

>勘弁してーってお願いしたくなるようなうんこ送りつけて奇妙な主張を
>しつこくしてくるのが関の山。
>いやほんとしつこくされるよ。
>住所なんか当たり前のように調べてくるしね。

匿名なのにどうやって送りつけるんだい？
話が矛盾してるぞ。
154 ：おい：2008/07/25(金) 17:56:19 .net: Shut the fuck up and write some code.
155 ：デフォルトの名無しさん：2008/07/25(金) 21:14:17 .net: >>153
ほんとに頭の悪い子だな。
頭の悪さは公表しなくていいからそっと隠しておけよ。
100回読みなおせばお前でも理解できるかも知れんから読みなおせ。
156 ：デフォルトの名無しさん：2008/07/25(金) 22:09:22 .net: とりあえず Win + U×2 しとけ
157 ：デフォルトの名無しさん：2008/07/25(金) 23:05:35 .net: 自分の声から音声を合成し、入力したテキストを読み上げられるソフトを、OKIが発売した。病気などで声を失った人に、自分の声の代わりに使ってもらいたいという。
http://www.itmedia.co.jp/news/articles/0807/25/news011.html
158 ：デフォルトの名無しさん：2008/07/26(土) 00:49:05 .net: 声を失った人が、自分の声から音声を合成することは出来ないと思うのだが
159 ：158：2008/07/26(土) 00:50:41 .net: って書いてから記事を読んで理解した。すまそ。
160 ：デフォルトの名無しさん：2008/07/27(日) 00:18:05 .net: >>146
そんなの匿名でやればいい話
161 ：デフォルトの名無しさん：2008/07/27(日) 00:26:50 .net: まだ作ってないのかおまえら
162 ：デフォルトの名無しさん：2008/07/27(日) 09:42:30 .net: >>160
だからお前がやればいいだろ。
オプソ厨の最大の欠点は、人が作ったものはクレクレ言って、オプソにしなければ
ならないと一生懸命言うけど、自分では何も作らないことだな。
社会正義のためとか言うけど、そんなものに興味があるなら自分でやれ。
おれは全然興味ない。
163 ：デフォルトの名無しさん：2008/07/27(日) 11:30:58 .net: ところでバーローの蝶ネクタイ型変声機みたいな物はできるのかね？
164 ：デフォルトの名無しさん：2008/07/27(日) 11:56:39 .net: ぼかりすは似たようなもんだと思う。
165 ：デフォルトの名無しさん：2008/07/27(日) 14:23:25 .net: 韻律も含めて他人の声に変換してもらいたいなー
166 ：デフォルトの名無しさん：2008/07/27(日) 16:18:32 .net: しかし、オープンソースにするとパッチとかがウザイとか言うけど、
どう考えてもクローズドの方が、オープンにしろって要望も含めて、あれやってくれこれやってくれって五月蝿いと思うがｗ

まぁ、かまってちゃんならそっちの方がいいんだろうけどｗ
167 ：デフォルトの名無しさん：2008/07/27(日) 19:03:07 .net: 某コナンの蝶ネクタイ型変声機みたいな物はどうやって作るんだい？
そのアルゴリズム等を提案してみてください。
168 ：デフォルトの名無しさん：2008/07/27(日) 20:30:52 .net: 変声機はどっちかというと、元の音声をいかに消すかが肝だと思うｗ
169 ：デフォルトの名無しさん：2008/07/27(日) 20:37:01 .net: 音声認識して音声合成しなおせばいいんじゃね？
170 ：デフォルトの名無しさん：2008/07/29(火) 12:29:37 .net: ところで音声合成ってどうやって作るんだい？
アルゴリズムを提案してくれ。
171 ：デフォルトの名無しさん：2008/07/29(火) 17:44:36 .net: 基本は、サンプリングのツギハギ。
声帯を物理シミュレーションしてるのは、あるのかな？
172 ：デフォルトの名無しさん：2008/07/30(水) 01:18:20 .net: >>170
ttp://recognition.web.fc2.com/synthe/

>>171
党・本多
173 ：デフォルトの名無しさん：2008/08/01(金) 00:14:21 .net: 94氏
この掲示板みてたら、現状を報告してくれ。
174 ：デフォルトの名無しさん：2008/08/03(日) 19:07:12 .net: 変声機つくっても犯罪用途しか思いつかないなぁw
175 ：デフォルトの名無しさん：2008/08/03(日) 20:42:59 .net: マイナー分野である音声合成技術が、オレオレ詐欺に使われることで一躍世間の注目を浴びる、と。
176 ：デフォルトの名無しさん：2008/08/03(日) 21:08:32 .net: それ既にあるぞ
177 ：デフォルトの名無しさん：2008/08/04(月) 19:12:59 .net: こんなんみつけた
ttp://d.hatena.ne.jp/shoozhoo/20080712

やっぱ英語用の音声合成は日本語じゃ役立たずなのか？
178 ：デフォルトの名無しさん：2008/08/06(水) 22:21:13 .net: ところで誰か音声合成プログラムを作っている人いるかね？
179 ：デフォルトの名無しさん：2008/08/12(火) 00:25:48 .net: ﾎﾞｲｰﾝ
180 ：デフォルトの名無しさん：2008/09/04(木) 03:02:37 .net: >>171
面白い特許を見つけました。シンセサイザーの方では表現力が高いとして
９０年代に研究され尽くされた物理モデリングアルゴリズムDWGを
音声シンセサイザーに応用するものです。
http://www.patentgenius.com/patent/5528726.html
181 ：デフォルトの名無しさん：2008/09/08(月) 11:38:26 .net: よく見つけたな。ちょっと読んでみるか
182 ：デフォルトの名無しさん：2008/09/15(月) 06:39:06 .net: http://prius.hitachi.co.jp/prius/pc/2005may/yomiwaza/index.html
＞※本ソフトウェアが出力する読み上げ音声の著作権は株式会社日立製作所が保有します。

これってどうなの？
ここまで著作権を主張できるもんなの？
183 ：デフォルトの名無しさん：2008/09/15(月) 10:37:50 .net: フォントの著作権の問題に似てるな
184 ：デフォルトの名無しさん：2008/10/14(火) 11:10:46 .net: そろそろ何か作りれたか？
185 ：デフォルトの名無しさん：2008/10/14(火) 21:24:36 .net: 日本語でおｋ
186 ：デフォルトの名無しさん：2008/10/18(土) 15:12:50 .net: >>94氏へ
この掲示板みてたら、なんでもいいから報告をしてくれ。
187 ：デフォルトの名無しさん：2008/12/24(水) 02:45:19 .net: http://iwasete.net/
188 ：デフォルトの名無しさん：2009/01/03(土) 11:49:06 .net: age
189 ：デフォルトの名無しさん：2009/02/05(木) 07:16:16 .net: 保守
190 ：デフォルトの名無しさん：2009/02/05(木) 11:09:11 .net: >>182
しかし読み上げた結果の音声を自由に使えなきゃ意味ないよな。
191 ：デフォルトの名無しさん：2009/02/05(木) 11:11:41 .net: そういえば、ちょっと前にアニメのキャラクターで音声合成するのがあったけど、あのベースになっているアルゴリズムはなんなんだろ。
藤崎モデルだっけ、あれとはちょっと違うでしょ？
192 ：デフォルトの名無しさん：2009/02/08(日) 10:49:41 .net: 波形接続だろ
193 ：デフォルトの名無しさん：2009/02/08(日) 11:15:27 .net: でも、通常の波形接続リソースとは変えないとキャラっぽいしゃべりは無理だろ？
194 ：デフォルトの名無しさん：2009/02/09(月) 00:16:52 .net: キャラ声でキャラせりふを録音しておくんだからＯＫだろ？
195 ：デフォルトの名無しさん：2009/02/09(月) 09:26:51 .net: それじゃうまくいかないんじゃないか？
とはいえ、音声リソースに手作業で情報追加すれば何とかなるのかや。
196 ：デフォルトの名無しさん：2009/02/09(月) 10:49:52 .net: 量を確保できればなんとかなる。それが波形接続のメリット。
韻律モデルが重要になるが、機械学習のアルゴリズムも確立してきてるし、
そこそこのクオリティはすぐ出せるはず。
197 ：デフォルトの名無しさん：2009/02/10(火) 23:16:28 .net: >>196
統計だから最適なデータを用意すればそこそこできるのはわかるけど、
ウェブサービスだったのは意外とすぐに出てきた感じがしたんだ。

大量に用意したら、波形を分割するて作業とか増えるじゃん。
韻律モデルは声優の真似ができるほどのものはまだないと思ってたけど。
198 ：デフォルトの名無しさん：2009/02/14(土) 04:41:05 .net: overlap add
199 ：デフォルトの名無しさん：2009/02/17(火) 14:31:50 .net: >>198
わからんな、単語並べられてもさ。
200 ：デフォルトの名無しさん：2009/02/17(火) 20:41:36 .net: >>191 のアルゴリズムがoverlap additionだと言いたいんだろうな
201 ：デフォルトの名無しさん：2009/02/23(月) 11:31:09 .net: 簡単な波形接続プログラム作ってみた
Ne_46114
makaron
202 ：デフォルトの名無しさん：2009/02/23(月) 18:17:57 .net: ttp://www1.axfc.net/uploader/Ne/so/46114
みんながみんなお前や俺のようなワレザーじゃないんだからURLを併記するべき
それはそうと入力した語句がwavに反映されない。

buliding database
done
input text

こんにちわ。

1 sp /*/ 614 400 242
203 ：デフォルトの名無しさん：2009/02/24(火) 08:14:40 .net: 申し訳ない。上でそこ使ってたから、デフォかと思ったよ。

で、音が出ないってのだけど、dataフォルダの中にポッドキャストの
wavファイルは作ってあるんだよね？んー、なんでだろう。
204 ：デフォルトの名無しさん：2009/02/24(火) 21:59:55 .net: もちろん
全てREADMEの通りに行った
原因が思いつかないなら結構場所食うし消すわ
205 ：デフォルトの名無しさん：2009/03/09(月) 12:22:15 .net: >>202
すいません。それをもう一度うｐしてくれませんか？

後このソフトはオープンソースですか？
206 ：デフォルトの名無しさん：2009/03/09(月) 20:05:03 .net: おっと盗賊が現れた。
207 ：デフォルトの名無しさん：2009/03/11(水) 12:26:04 .net: >>201
>>202のURLからダウンロードできないんだが・・・
もう一度うｐしてくれるか？
208 ：デフォルトの名無しさん：2009/03/11(水) 12:44:47 .net: もうなくなっているようだな。
209 ：デフォルトの名無しさん：2009/03/11(水) 15:14:17 .net: だれでもいいからうｐしてくれ
210 ：デフォルトの名無しさん：2009/03/26(木) 11:58:27 .net: そういえば、声を好きな人の声に変換するものがあったけど、あのアルゴリズムはどうなっているんだろう？
211 ：デフォルトの名無しさん：2009/03/31(火) 09:09:02 .net: 好きな人の声ってなんだよ？
212 ：デフォルトの名無しさん：2009/03/31(火) 11:13:33 .net: 俺で言えば佐伯香織ちゃんの声だよ
213 ：デフォルトの名無しさん：2009/03/31(火) 17:26:09 .net: 音声認識して音声再生してるだけじゃないの？
214 ：デフォルトの名無しさん：2009/04/03(金) 15:48:54 .net: >>210
それって声質変換のことじゃないの？
声質変換って声の周波数で他人の声に変えることかな？
215 ：デフォルトの名無しさん：2009/04/04(土) 00:09:17 .net: ふぉるまんと0の成分を上げ下げすればいいんじゃね？
216 ：デフォルトの名無しさん：2009/04/04(土) 20:24:59 .net: >>215
それで本当に他人の声に変えることができるの？
だれか詳しい人教えて
217 ：デフォルトの名無しさん：2009/04/05(日) 02:42:50 .net: >>216
おとこ、おんな、こども、
っぽく変換はできる。

でも、20年前の技術だぞ？
218 ：デフォルトの名無しさん：2009/04/11(土) 16:55:30 .net: 声質変換技術で他人の声の変換するにはどのようにすればいいのかな？
219 ：デフォルトの名無しさん：2009/04/11(土) 20:22:18 .net: んなの英語の論文調べなよ。
220 ：デフォルトの名無しさん：2009/05/25(月) 22:41:33 .net: 声優いわく、BIGLOBEのコエラボは５日間の収録だそうだぞ
221 ：デフォルトの名無しさん：2009/05/26(火) 22:16:46 .net: ttp://pinpon.okilab.jp/potential.html
ワロタｗｗ
222 ：デフォルトの名無しさん：2009/05/27(水) 00:07:24 .net: >>221
ちょーやばくねー。
223 ：デフォルトの名無しさん：2009/05/31(日) 03:43:40 .net: >>221
なんかムカつく。でもそれがいい
224 ：デフォルトの名無しさん：2009/06/30(火) 15:03:16 .net: age
225 ：デフォルトの名無しさん：2009/07/02(木) 08:08:16 .net: なぜ、VOICE TEXTがでてこない・・・
市販の音声合成ではあれの出来がかなりよい
226 ：デフォルトの名無しさん：2009/07/02(木) 21:18:35 .net: Harukaってコメント程度ならいいけど、
聞き続けるとムカつきそうｗ
227 ：デフォルトの名無しさん：2009/07/03(金) 08:01:09 .net: >>226
確かにw
最初は可愛いと思うがだんだんゆとりの女子高生に思えてきたw
228 ：デフォルトの名無しさん：2009/08/13(木) 20:00:14 .net: 声質を変換できる方法ってあるのかな？
229 ：デフォルトの名無しさん：2009/08/13(木) 20:17:19 .net: うん
230 ：222.248.109.70：2009/08/17(月) 17:45:20 .net: Q. 自動保守#K9K?_D[L　とは一体何なのか？
A. 外部サイトへの突撃大好きな真性厨房

韓国突撃でお馴染みの自動保守
最近は自動焼人 ★として２ちゃんねるのボランティアにも精を出す日々
だがそんな彼にも、人間らしい部分はあったのだ…

名言集
『アパッチ砲はワシが作った』
『お前が規制系キャップ取れるか審査してやるよ』
『いつもサボってばかりのキャップがウゼえ』
『俺、100人規模の集団サイバーテロの主犯だったこともあるんだぜ』
『俺の経歴カックイイだろ？』

最近のニュース
　8月15日の韓国突撃の際に歴史的大敗を喫する。ラジオでの敗戦宣言のときに声が震えていた
　本人は体調不良と言っているが…

----------------------------------------------
この自動焼人 ★メールマガジンの配信停止をご希望される方は
http://qb5.2ch.net/test/read.cgi/sec2chd/1250169591/
にて自動焼人 ★までご連絡ください
231 ：デフォルトの名無しさん：2009/08/31(月) 22:39:57 .net: 声質を変換できる方法ってあるの？
232 ：デフォルトの名無しさん：2009/08/31(月) 22:42:46 .net: うん
233 ：デフォルトの名無しさん：2009/10/03(土) 16:56:55 .net: ほしゅ
234 ：デフォルトの名無しさん：2009/10/04(日) 11:19:20 .net: VOCALOID2 シーケンス (VSQ) ファイルのフォーマット (推定)
ttp://www5d.biglobe.ne.jp/~noocyte/Programming/FileFormat/VSQ.html
235 ：デフォルトの名無しさん：2010/02/11(木) 11:05:27 .net: つOpenJtalk
236 ：デフォルトの名無しさん：2010/02/14(日) 19:22:47 .net: 肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう？
誰か教えて
237 ：デフォルトの名無しさん：2010/02/15(月) 07:51:28 .net: あったね
238 ：デフォルトの名無しさん：2010/02/16(火) 14:06:08 .net: >>237
どうやるの？
239 ：デフォルトの名無しさん：2010/02/16(火) 21:04:17 .net: やっぱり音響モデルじゃないのかな
240 ：デフォルトの名無しさん：2010/02/16(火) 23:34:34 .net: >>239
音響モデル？
詳しく教えて
241 ：デフォルトの名無しさん：2010/02/27(土) 20:30:27 .net: 肖像画から頭蓋骨のCGを作成して声を再現する奴があったと思うんだがあれはどうやるんだろう？
誰か教えて
242 ：デフォルトの名無しさん：2010/02/27(土) 23:15:36 .net: あったね
243 ：デフォルトの名無しさん：2010/02/27(土) 23:24:51 .net: >>242
どうやるの？
244 ：デフォルトの名無しさん：2010/02/28(日) 13:02:52 .net: やっぱり音響モデルじゃないのかな
245 ：デフォルトの名無しさん：2010/02/28(日) 16:19:26 .net: >>244
日本音響研究所に肖像画から頭蓋骨のCGを作成して声を再現するものがあったと思うがあれはどうやるの？
246 ：デフォルトの名無しさん：2010/02/28(日) 17:41:40 .net: 肖像画からCGを作成するのは六角大王の手法でできるんじゃね
247 ：デフォルトの名無しさん：2010/02/28(日) 18:38:51 .net: 涼宮ハルヒのエンドレス夏休みを見ている気分ですねわかります
248 ：デフォルトの名無しさん：2010/03/02(火) 23:08:24 .net: >>246
どうやってやる？
249 ：デフォルトの名無しさん：2010/03/21(日) 23:17:01 .net: マジレスすると、頭蓋のサイズから声道長を推定して、
フォルマント位置を決めるって感じか。
ま、肖像画とかから復元した声ってほとんど当てにならないけどな。
250 ：デフォルトの名無しさん：2010/04/12(月) 00:29:58 .net: >>249
肖像画からどうやって頭蓋のサイズを出してるの？
251 ：デフォルトの名無しさん：2010/04/12(月) 19:11:06 .net: 俺の写真から声を復元したとして、
俺の声にどこまで近くなるんだろうか？
252 ：デフォルトの名無しさん：2010/04/12(月) 23:10:15 .net: >>251
そもそも顔写真から頭蓋のサイズを割り出すにはどうやって割り出せばいいの？
253 ：デフォルトの名無しさん：2010/04/15(木) 12:59:30 .net: その写真に写りこんでいる、寸法の判っているものを基準にすればいいんじゃね
254 ：デフォルトの名無しさん：2010/04/15(木) 17:26:26 .net: ネッシーの捏造写真だってサイズ割り出されてたもんな
255 ：デフォルトの名無しさん：2010/04/15(木) 17:34:19 .net: 波紋の伝播周期からサイズが決定できるってことかな。
256 ：デフォルトの名無しさん：2010/04/15(木) 19:19:57 .net
257 ：デフォルトの名無しさん：2010/04/15(木) 22:31:48 .net: w
258 ：デフォルトの名無しさん：2010/04/17(土) 18:26:20 .net: >>253
でも肖像画に寸法の判っているものがなかったらどうするの？
259 ：デフォルトの名無しさん：2010/04/17(土) 20:29:56 .net: 何でお前らそんなに世話焼きなの？
260 ：デフォルトの名無しさん：2010/04/19(月) 11:43:36 .net: >>258
そんときは、目玉の大きさとか目の感覚とか、統計的手法に頼ればいいんじゃね

>>259
暇なんじゃね?
261 ：デフォルトの名無しさん：2010/04/19(月) 13:10:40 .net: >>258
声のキャラクタってのは体格以外の要素も絡むわけで、
例えば故人の歌声を再現、とかやりたい場合は大抵残念な結果になるよ。
そもそもここで聞くより元の論文探して見当つけたほうが早くね？

>>260
こういうのも頭部画像だけで測れちゃったり？
ttp://m.onet.pl/_m/94cfc8bff0ea6227e4a8547781d30f45,35,1.jpg
ttp://image.blog.livedoor.jp/laba_q/imgs/1/9/19f92fc1.jpg
262 ：デフォルトの名無しさん：2010/04/19(月) 19:22:54 .net: サイズはパラメータにしておいて、
平均値を使った場合と
その前後の値を使った場合と全部試してみて
この中のどれかですって言えばいいんじゃない
263 ：デフォルトの名無しさん：2010/04/20(火) 17:55:12 .net: >>261
ググッても見つからないんだが・・・
264 ：デフォルトの名無しさん：2010/04/21(水) 19:02:15 .net: >>261
探しても見つからないよ
265 ：デフォルトの名無しさん：2010/04/22(木) 22:39:13 .net: 一卵性双生児の場合、声（歌声も）は全く同じではないだろ
だから頭部の数値だけでは不十分な気がする
266 ：デフォルトの名無しさん：2010/04/22(木) 22:56:07 .net: >>265
でも↓を見ると
http://www.onkyo-lab.com/mv.html

>そこで肖像画、写真、銅像等があれば、性別、身長、年齢、顔形を特定してその人の発声器官をコンピュータ上で電子回路に置き換え、
>シミュレーションして声を合成することが出来るのです。

って書かれているんだが・・・・

てかそもそも肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
267 ：デフォルトの名無しさん：2010/04/22(木) 22:58:41 .net: 声を合成できる事と
その声が実際の声と一致している事とは別だよ
268 ：デフォルトの名無しさん：2010/04/23(金) 13:27:11 .net: >>267
うん。だけど肖像画からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの？
269 ：デフォルトの名無しさん：2010/04/23(金) 23:17:59 .net: 日本音響研究所に不可能はない
270 ：デフォルトの名無しさん：2010/04/24(土) 00:03:36 .net: >>269
だからどうやってやったの？
271 ：デフォルトの名無しさん：2010/04/24(土) 00:15:07 .net: 日本音響研究所のおっさんに直接聞けよ
272 ：デフォルトの名無しさん：2010/04/24(土) 23:13:48 .net: >>271
直接聞いても企業秘密で答えてくれない
おまえらの力で考えるしかない
273 ：デフォルトの名無しさん：2010/04/25(日) 09:48:56 .net: >>266
肖像画が残るような人物なら性別は記録からすぐ分かるだろ
低脳

顔の各部分の寸法に関しては、
肖像画とその人物の民族平均を比較するんだよ。
低脳
274 ：デフォルトの名無しさん：2010/04/27(火) 23:30:32 .net: 【歴史】169センチ、62キロだった龍馬　大男伝説に一石　山梨
http://tsushima.2ch.net/test/read.cgi/newsplus/1272325001/
甲州の研究家襟幅から算出
甲州市塩山上井尻の郷土史研究家、矢崎勝巳さんが写真から体格を測定する方法を
考案し、幕末の志士・坂本龍馬（１８３５～６７年）の身長を１６９センチ、体重を６２・１キロと
算出した。平均身長が１５０センチ台だった幕末当時、龍馬の身長は５尺７寸（１７３センチ）
とも６尺（１８２センチ）とも伝えられ、長い間大男だったとされてきたが、一石を投じそうだ。

矢崎さんは、当時の着物の襟幅が６センチか６・５センチの２種類しかないことに着目した。
６センチとすると背が低くなりすぎるため、６・５センチとして龍馬の立位の肖像写真で算出した。
２００７年１０月の日本人類学会で、龍馬の身長は１７０センチに満たなかったとの試算を
紹介したのに続き、昨年１０月の同学会では体格指数ＢＭＩで体重を試算する方法も発表した。

このほど、龍馬のＢＭＩ指数を標準体形の「１８・５以上２５未満」と仮定し、標準値の
（以下省略）

ソース：読売新聞
http://www.yomiuri.co.jp/e-japan/yamanashi/news/20100426-OYT8T01349.htm
画像：坂本龍馬の肖像写真
http://www.yomiuri.co.jp/photo/20100426-932069-1-L.jpg
275 ：デフォルトの名無しさん：2010/04/27(火) 23:58:20 .net: ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
276 ：デフォルトの名無しさん：2010/04/28(水) 18:02:44 .net: おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
277 ：デフォルトの名無しさん：2010/04/28(水) 18:36:50 .net: ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているの？
278 ：デフォルトの名無しさん：2010/04/28(水) 20:13:21 .net: そして誰もいなくなった
279 ：デフォルトの名無しさん：2010/04/29(木) 23:02:27 .net: ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
280 ：デフォルトの名無しさん：2010/04/30(金) 01:37:52 .net: 男の声をピッチ上げるだけだと、女っぽくならないのは何故だろう
281 ：デフォルトの名無しさん：2010/04/30(金) 01:50:08 .net: ボカロで言うGENとかUTAUでいうgフラグを調整する必要がある
282 ：デフォルトの名無しさん：2010/05/01(土) 14:24:27 .net: ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
283 ：デフォルトの名無しさん：2010/05/01(土) 19:24:01 .net: ねえねえ証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
284 ：デフォルトの名無しさん：2010/05/04(火) 18:39:42 .net: おーい証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出しているんだろう？
285 ：デフォルトの名無しさん：2010/05/04(火) 23:25:22 .net: 発声時における声帯から口までの空気の流れを粒子法でモデル化して
音声合成を作ってみたいと急に思い立ったんだが、右も左も分からない。

とりあえず、これは圧縮性流れと見なしてシミュレートすればいいのか
286 ：デフォルトの名無しさん：2010/05/06(木) 23:04:54 .net: ところで証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの？
287 ：デフォルトの名無しさん：2010/05/07(金) 00:23:20 .net: >>286
一般的には統計を利用する。
288 ：デフォルトの名無しさん：2010/05/07(金) 16:24:45 .net: >>287
どうやってやるの？
具体的に教えてくれる？
289 ：デフォルトの名無しさん：2010/05/07(金) 16:57:59 .net: てかそもそも証明写真などの顔写真からどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの？
290 ：デフォルトの名無しさん：2010/05/20(木) 15:00:33 .net: 証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの？
291 ：デフォルトの名無しさん：2010/06/08(火) 23:57:00 .net: ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの？
292 ：デフォルトの名無しさん：2010/06/11(金) 13:49:50 .net: >>291
とりあえず証明写真見て性別を5割以上の確率で当てられないバカはお前くらいじゃねーの
293 ：デフォルトの名無しさん：2010/06/12(土) 22:08:09 .net: ところで証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの？
294 ：デフォルトの名無しさん：2010/06/12(土) 23:22:47 .net: きっと後ろの壁に横線が並んでるんだよ。
295 ：デフォルトの名無しさん：2010/06/13(日) 15:05:51 .net: うん。だけど証明写真などの顔写真から統計を使ってどうやって性別、身長、年齢、顔形、顔の各部分の寸法を割り出すの？
296 ：デフォルトの名無しさん：2010/07/06(火) 18:15:36 .net: >>1を見て
鏡の国のレジェンドでのりぴーの声を1音ずつ喋らすことができるんだけど
それを録音してX68にADPCMで取り込んでおいて順次再生して「おまんこ」とか
「ちんちんいれて」とか喋らせて大喜びしてたのを思い出した
297 ：デフォルトの名無しさん：2010/12/07(火) 04:06:55 .net: 音について質問です

例で
Windows Wave 無圧縮 PCM 16 bit 44kHz サンプリング　ステレオ

wav format
http://www.kk.iij4u.or.jp/~kondo/wave/#wav
http://hooktail.org/computer/index.php?Wave%A5%D5%A5%A1%A5%A4%A5%EB%A4%F2%C6%FE%BD%D0%CE%CF%A4%B7%A4%C6%A4%DF%A4%EB

波形データはステレオの場合ＬＲＬＲ・・　と並ぶなどの説明までは沢山の日本語サイトであるんですけど
その多くがWAV ファイルヘッダ情報ばかり詳しく述べて肝心のデータ部分の説明がおざなりで解りません。

波形データ符号付き整数 (-32768 - 32767) 16ビットの場合　FFFF8000 ～ 0 ～ 7FFF

リトルエンディアンにすると　00 80 FF FF ～ 00 00 00 00 ～ FF 7F 00 00　ですよね。

data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR　ですよね。

解らないのは、リニア PCM の場合
整数16bit　/　リトルエンディアン
L0L1L2L3　　/　L3 L2 L1 L0
R0R1R2R3　　/　R3 R2 R1 R0

格納順番は
これ？＞ data (波形データのバイト数) L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0 L3 R3 L2 R2 L1 R1 L0 R0
コレ？＞ data (波形データのバイト数) L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0 L3 L2 L1 L0 R3 R2 R1 R0

日本語サイトでここが詳しいとリンクしている英語サイト
https://ccrma.stanford.edu/courses/422/projects/WaveFormat/
では矢印のつけ方がどちらとも受け取れるので
音が変
298 ：デフォルトの名無しさん：2010/12/07(火) 07:51:53 .net: >リトルエンディアンにすると　00 80 FF FF ～ 00 00 00 00 ～ FF 7F 00 00　ですよね。

それ32bitじゃね？
299 ：デフォルトの名無しさん：2010/12/07(火) 14:18:42 .net: >>297
16ビットは2バイトだと気がつけば格納順番も分かると思います。

波形データ符号付き整数 (-32768 - 32767) 16ビットの場合　8000 ～ 0 ～ 7FFF
リトルエンディアンにすると　00 80 ～ 00 00 ～ FF 7F
data (波形データのバイト数) 波形データL 波形データR 波形データL 波形データR

整数16bit/リトルエンディアン
L0L1　　/　L1 L0
R0R1　　/　R1 R0

格納順番はこうなります。
data (波形データのバイト数) L1 L0 R1 R0 L1 L0 R1 R0 L1 L0 R1 R0
300 ：デフォルトの名無しさん：2010/12/07(火) 23:06:21 .net: SAPIの話かと思ったらすれ違いみたい
301 ：297：2010/12/08(水) 08:25:46 .net: ありがと　やっと謎がとけたよ
音声組替えで音の基本配置がわかんなかったから音声合成のこのスレにきたんですが　スレ違いごめんなさい
変調なんかもドコのスレだろ？
302 ：デフォルトの名無しさん：2010/12/09(木) 02:03:55 .net: グーグル検索
↓
念のためうぷ（´・ω・｀）まわいが重要

グーグル検索
↓
やらなくてもやられるし　日本語以外話せないし

テレビやネットで説明
303 ：デフォルトの名無しさん：2011/01/05(水) 18:49:53 .net: >>1
何という手間のかかる事を...。
波型とかエンベロープとか、学ばなきゃいけない事が、
山ほどあるのに。
304 ：デフォルトの名無しさん：2011/01/15(土) 16:12:14 .net: これの話者適応とか使えそうなんだけど、具体的なやり方がわからん
http://www.sp.nitech.ac.jp/index.php?%A5%DB%A1%BC%A5%E0%2F%B8%A6%B5%E6%C6%E2%CD%C6%2F%B2%BB%C0%BC%B9%E7%C0%AE
305 ：デフォルトの名無しさん：2011/01/15(土) 17:34:46 .net: >>304
話者適応は英語で Speaker Adaptation です。
HMM音声合成ツールキット HTS 2.0以降に
その機能があるのでソースを読めばわかると思います。

HMM-based Speech Synthesis System (HTS) - History
http://hts.sp.nitech.ac.jp/?History#z5d7dda6
>December 29, 2006
>　HTS version 2.0 was finally released :-)
>　The new features are
>　* Speaker adaptation, adaptive training, and semi-tied covariance transforms are supported for multi-stream HMMs/MSD-HMMs.
>　　* MLLRMEAN, MLLRCOV, and CMLLR-based adaptation.
>　　* CMLLR-based adaptive training.
>　　* Decision trees for context clustering can be used to define regression classes for adaptation.
>　　* HMGenS can read MLLRMEAN, MLLRCOV, CMLLR, and SEMIT transforms for adaptation.
306 ：デフォルトの名無しさん：2011/01/15(土) 22:00:38 .net: >>305
サンクス。ドキュメント見ながら色々試してみようと思う
とりあえずHTSの話者適応デモ動かしてるけど、終わらないし、2～3日かかるらしい
最終的にはwavファイルとその文章を与えたらその声で音声合成できるようにしたい
307 ：デフォルトの名無しさん：2011/01/24(月) 21:38:46 .net: 統計学と信号処理と音声言語処理と機械学習を
勉強すれば何とかなるかな。
308 ：デフォルトの名無しさん：2011/02/06(日) 11:25:55 .net: >>306
できた？興味あるんだけど
309 ：デフォルトの名無しさん：2011/02/17(木) 17:24:58 .net: >>308
できてない
とりあえず、デモのデータを使って音響モデルを作成するところまでできた
音響モデルができたらテキストからその声で音声の再生もできる
今は、自作のデータからモデル作る途中でエラーが出てるからそれの対処中
310 ：天使 ◆uL5esZLBSE ：2011/07/03(日) 09:38:03.37 .net: Rubyバカにしてる子ってさ
変数に＄ついてる言語触ってるって事だよね

いちいちSHIFT＋４キーおして＄打ちまくってる感触はどう？
でもお前はゴミなのにねｗ
311 ：天使 ◆uL5esZLBSE ：2011/07/06(水) 01:45:59.76 .net: これ；デリミタっていうんだけどさ、これをつけなきゃエラーになるような
そんな言語使ってる奴ってどうみてもゴミだと思うんだけど

もしかして「；」これ打ち忘れてコンパイルエラー出すのが楽しいの？
そうか、二度と話かけんなよ

死ねよゴミ
312 ：デフォルトの名無しさん：2011/08/02(火) 06:50:05.52 .net: ゆっくり声のライブラリって規則合成ってのらしいんだけど、これは素片接続法やHMM合成とは全く違う方法なの？素片接続の一種？
313 ：デフォルトの名無しさん：2011/08/03(水) 19:03:56.08 .net: 規則合成は、規則に基づいて音声合成することなので、合成方式が波形接続かHMM合成かとは別。というか、上の分類。
ゆっくりは、たぶん、LPCとかのパラメータからのボコーダ方式。ボコーダという点ではHMM合成と同じ。
314 ：デフォルトの名無しさん：2011/08/05(金) 06:51:28.40 .net: >>313
ありがとう。勉強になります。
315 ：デフォルトの名無しさん：2012/04/24(火) 14:08:11.51 .net: NHK Eテレ Rの法則という番組にて歌声合成が取り上げられるようです．
また，その企画に伴い，4/25から番組HPでUTAU音源がDL出来るようになります．
男声と女声の2音源です．その音源作りを担当させていただきました！
316 ：デフォルトの名無しさん：2012/06/01(金) 11:31:32.53 .net: UTAUよりまともな音声合成ソフトないの？
317 ：デフォルトの名無しさん：2012/07/09(月) 20:44:26.02 .net: 日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの？
詳しく教えてくれ
318 ：デフォルトの名無しさん：2012/07/16(月) 20:36:29.06 .net: 日本音響研究所が開発したモンタージュボイスっていうやつどうやればできるの？
詳しく教えてくれ
319 ：デフォルトの名無しさん：2012/08/12(日) 22:40:26.39 .net: 誰かHMM音声合成を語れ
320 ：デフォルトの名無しさん：2012/10/28(日) 13:39:03.63 .net: フジテレビの杏梨ルネってどこの技術？
321 ：デフォルトの名無しさん：2013/05/01(水) 02:28:38.09 .net: >>320
なんかの記事でドコモのiコンシェルと同じを使ってるって言ってたな
それが確かならHOYAのVoiceTextってことになる
322 ：デフォルトの名無しさん：2013/05/01(水) 02:32:16.90 .net: なるほど
323 ：デフォルトの名無しさん：2013/05/04(土) 21:11:27.84 .net: おれの98は、ピポッと起動するから現在形
324 ：デフォルトの名無しさん：2013/05/07(火) 15:12:54.26 ID:qEqQNQf6O.net: 難しいな
325 ：デフォルトの名無しさん：2013/06/27(木) 16:17:04.80 .net: 　　　　　　　　　　　　　
326 ：デフォルトの名無しさん：2013/10/18(金) 09:34:37.17 .net: http://www.nicovideo.jp/watch/sm21933917
http://www.nicovideo.jp/watch/sm21947823
327 ：デフォルトの名無しさん：2013/11/03(日) 20:36:45.88 .net: 初音ミクとか目標にしてるんだろうけど意外に奥が深いんだよ。
328 ：デフォルトの名無しさん：2014/01/27(月) 14:18:06.62 .net: 判ります
329 ：デフォルトの名無しさん：2014/01/27(月) 15:00:50.44 .net: 初音ミクどころか歌唱よりさらに難しいといわれる読み上げに見える
330 ：デフォルトの名無しさん：2014/01/27(月) 15:05:33.72 .net: へっ？
どうみても歌唱やんこれ
331 ：デフォルトの名無しさん：2014/03/08(土) 16:28:12.83 .net: 帐
332 ：デフォルトの名無しさん：2014/04/04(金) 14:07:45.36 ID:Bqre4+dt.net: 初音ミク、って専属の声優さんがいるんじゃなかったかな？
その声優さんを機械のような質感にしているだけだと思うけどな。
333 ：デフォルトの名無しさん：2014/04/04(金) 14:11:49.55 ID:UPfoP0f4.net: 藤田咲さん
https://www.youtube.com/watch?v=yEDDVOmtbic
334 ：デフォルトの名無しさん：2014/04/07(月) 10:02:18.51 ID:Eg/nEWhY.net: >>333
紹介ありがとう。
やっぱり専属の声優さんいたんやな。
335 ：デフォルトの名無しさん：2014/04/07(月) 10:05:42.81 ID:Eg/nEWhY.net: 声優さんの合成音声をセリフから抽出するより。
お気に入りの声優さんに「あ～ん」までを発声してもらって。
それをタイピングと連動させるツールを作ればいいんでね？

音域を解析して、ネットラジオ等で音声素材を収集して。
埋められない言葉は、これまで収集したデータから予測するのは・・・。
考えただけでかなりのコスト^^;
336 ：デフォルトの名無しさん：2014/04/07(月) 10:36:56.71 ID:SBlJ2Fr+.net: こんなん出てたわ

https://www.youtube.com/watch?v=tUIQItrpYBE
https://www.youtube.com/watch?v=RyezC1p_pak
http://internet.watch.impress.co.jp/docs/news/20140404_642876.htm
http://game.watch.impress.co.jp/docs/news/20140221_636384.html
http://gigazine.net/news/20140404-pocket-miku/
http://nlab.itmedia.co.jp/nl/articles/1403/03/news057.html
http://japanese.engadget.com/2014/03/02/evocaloid/
http://www.amazon.co.jp/dp/4057504656/
http://www.dtmstation.com/archives/51888898.html
http://hitoriblog.com/?p=23019
http://www.otonanokagaku.net/nsx39/index.html
http://www.dtmstation.com/archives/51877546.html
http://otonanokagaku.net/nsx39/app.html
http://www.crypton.co.jp/cfm/news/2014/02/pocketmiku

歌詞モードは知らんけど
リアルタイムモードは子音がサポートされてないのが残念

リアルタイムでも子音出せるのはこちら
↓
https://www.youtube.com/watch?v=ka8-SpSkmZA
http://vocaloid.blog120.fc2.com/blog-entry-11373.html
337 ：デフォルトの名無しさん：2014/04/07(月) 11:05:45.64 ID:SBlJ2Fr+.net: ひとつURLにlついてなかったので
http://internet.watch.impress.co.jp/docs/news/20140404_642876.html
338 ：デフォルトの名無しさん：2014/04/07(月) 11:50:09.04 ID:ktMnCtsu.net: また、この専用アプリでは、初期状態で「あ」、「い」、「う」、「え」、「お」と割り当てられている5つのボタンに別の文字を割り当てることができたり、このボタン以外の文字をリアルタイムに選択して、本体のカーボンキーボードで歌わせることも可能とのことです。

発音するノートの直前に文字情報をMIDIシステム・エクスクルーシブで入力する

さらに、すべてをシーケンサ、DAWでコントロールして歌わせたという場合には、MIDIシステムエクスクルーシブを利用して歌詞を設定することも可能です。具体的には、発音させたいノートデータの直前に

F0 43 79 09 11 0A 00 ** F7

というエクスクルーシブデータを送るのですが、この**に文字番号を設定します。その文字番号についてはポケット・ミクのマニュアルに記載されていますが、「み」なら「65」、「く」なら「07」(いずれも16進数表記)のように1バイトの数字が割り振られています。

子音もいけるじゃん
339 ：デフォルトの名無しさん：2014/04/07(月) 12:14:36.44 ID:ktMnCtsu.net: なるほど
ようするにmidi音源として見ると安いな
http://m.youtube.com/watch?v=2-v5CB5krws
340 ：デフォルトの名無しさん：2014/04/07(月) 13:32:02.94 ID:ktMnCtsu.net: いくつかアイディア思いついたので
ム板らしく早速実装に取り掛かろう
http://m.youtube.com/watch?v=2-v5CB5krws
341 ：デフォルトの名無しさん：2014/04/07(月) 13:33:06.19 ID:ktMnCtsu.net: メモ
http://www.nicovideo.jp/watch/sm17357529
342 ：デフォルトの名無しさん：2014/04/12(土) 13:52:39.87 ID:UapBJj1i.net: USBでmidiノート投げれば子音も普通にしゃべれるのか
343 ：デフォルトの名無しさん：2014/04/13(日) 13:49:25.53 ID:xQQladLb.net: 専用スレ立ったのでプログラマ以外の人はこちらでどうぞ

【格安音源】ポケット・ミク【NSX-39】
http://anago.2ch.net/test/read.cgi/dtm/1397341323/
344 ：デフォルトの名無しさん：2014/11/04(火) 04:11:37.58 ID:9XcfLbNC.net: 画像の処理はよく話題になるが音声の処理はあまり話題にならないな
345 ：デフォルトの名無しさん：2014/11/04(火) 04:52:55.25 ID:UYsaPI6O.net: 臭いの処理も話題にならないよな
346 ：デフォルトの名無しさん：2014/11/06(木) 04:17:54.25 ID:iaZsweTc.net: 臭いはまだデバイスがほとんど一般向けに出てないからだろ。
たまにどこぞの大学や企業が試作品作ってるって話が聞こえるくらいだ。

市販されたとしてもプリンタのインクと同じで何かを放出する系だから
維持費がかかって一般人はなかなか買わないだろうね。
347 ：デフォルトの名無しさん：2014/11/06(木) 10:29:03.27 ID:keBB2IB1.net: 脳に電極を刺してエミュレートする機械の方が先に出るんじゃね
348 ：デフォルトの名無しさん：2014/11/06(木) 10:41:01.68 ID:Jg48RgBo.net: 味の処理も欲しい・・・です
349 ：デフォルトの名無しさん：2014/11/06(木) 12:43:09.93 ID:Uazf0Jll.net: 味は、舌に流す電流の波形でどうとか言う話を電通大（本家か大阪か忘れた）の誰かがしてた記憶が
350 ：デフォルトの名無しさん：2014/11/06(木) 15:03:14.07 ID:qOkBrttj.net: 舌の部位によって担当細胞が分かれてるのが本当だとしたら
電極を当てる場所も点じゃだめで面にしないとな
351 ：デフォルトの名無しさん：2014/12/31(水) 08:11:08.67 ID:ve7ao+6B.net: このスレタイほんと好きだわ
このタイトルだけでここまでもったスレと言えよう
352 ：デフォルトの名無しさん：2015/02/05(木) 01:04:37.93 ID:K5NTGqg/.net: MMDAgentの2等身のデータどっかにないですか
353 ：デフォルトの名無しさん：2015/02/22(日) 14:11:50.22 ID:TfAgRNIZ.net: いつのまにこんな本出てたし
認識じゃなくて合成の方だけど役に立ちそう

イラストで学ぶ音声認識 2015-01-24
http://www.amazon.co.jp/dp/4061538241
354 ：デフォルトの名無しさん：2015/09/04(金) 09:34:58.04 ID:efXmgHpK.net: サウンドプログラミング5
http://peace.2ch.net/test/read.cgi/tech/1231649001/
355 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/09/04(金) 20:29:59.47 ID:rFIKIt4e.net: C++とJavaScriptでしゃべるプログラム作らないといけない。俺にもできるかな？
356 ：デフォルトの名無しさん：2015/10/30(金) 12:09:18.03 ID:bGTI8z09.net: おｋ
357 ：デフォルトの名無しさん：2015/11/20(金) 17:28:57.26 ID:mFMTXsNS.net: 音声素材から1周期分の波形切り出す作業を手動でやりたくないんだがみんなどんな方法でやってるんだろうか
やっぱりフーリエ変換使わないとダメなのかな？
面倒臭そうだから使いたくないんだけど
358 ：デフォルトの名無しさん：2015/11/20(金) 18:15:54.49 ID:ipO3g4Qb.net: >>355
SpeechAPI
359 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/11/29(日) 12:18:02.04 ID:Xk8n1s0p.net: 「FM音源をあやつって正しく音を出したい」
OpenAL+ALUTと、ciscさんのFM音源エミュレータ
「FM Sound Generator」を使って、正しく音を出したい。

https://github.com/katahiromz/fmgengen2/blob/master/sample.cpp
https://github.com/katahiromz/fmgengen2

おかしな音が出ます。たぶんFM音源の使い方が間違っています。
修正方法を教えて下さい。よろしくお願いします。
360 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/11/29(日) 14:10:38.11 ID:Xk8n1s0p.net: たすけて
361 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/11/29(日) 19:53:25.61 ID:RQ97x6ZU.net: お助けを！
362 ：デフォルトの名無しさん：2015/11/29(日) 21:01:39.79 ID:pCZuJ7Kp.net: >>359-361
マルチポストやめようよ

http://peace.2ch.net/test/read.cgi/tech/1181782128/
http://hello.2ch.net/test/read.cgi/i4004/1430836648/
https://teratail.com/questions/21294
363 ：デフォルトの名無しさん：2015/11/30(月) 21:29:22.80 ID:xNC+/SUX.net: FM音源ってフーリエ級数じゃない方のやつか
364 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/11/30(月) 22:03:02.28 ID:UQmO47jh.net: >>359
私の掲示板に書き込みがあり、この件は解決しました。
365 ：デフォルトの名無しさん：2015/11/30(月) 22:55:27.43 ID:a6fnRtX4.net: OpenALもFM Sound Generatorもよくわからんけど
いろいろいじっててやっと解決したと思ったらすでに解決してた…

問題だったのはYM2203クラスのinit()に設定したクロック値が小さすぎたのと
下記みたいにYM2203クラスのcount()の前に音声波形をmix関数で生成しなければ
ならないってことかな

　　1.set_pitch、note_on等のイベント
　　　↓
　　2.mixで必要な時間分だけ波形生成
　　　↓
　　3.countで内部タイマーを進める(2で波形生成した時間分)
　　　↓
　　4.以下1～3の繰り返し

あと、マルチポストして解決したならそれぞれに
解決内容の詳細リンクを張るなりしたほうがいいんじゃないかな？

http://katahiromz.bbs.fc2.com/reply/10466094/34/
366 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/11/30(月) 23:19:44.48 ID:UQmO47jh.net: >>365
分かりやすい解説有り難うございます。テラテイル以外の投稿全部に
解決リンクを付けました。テラテイルには明日書き込む予定です。
367 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/04(金) 10:34:43.92 ID:hkRYJkWf.net: https://teratail.com/questions/21704
【FM音源エミュレータをあやつって正しく音を出したい２】

前回（https://teratail.com/questions/21294）の続きです。

OpenAL + ALUTと、ciscさんのFM音源「FM Sound Generator」を
使って、正しく音を出したい。

https://github.com/katahiromz/fmgon/blob/master/soundplayer.cpp
https://github.com/katahiromz/fmgon

フルートの音で、カエルの歌を演奏するプログラムですが、
なぜか音が途切れず、重なってしまい、輪唱みたいになってしまいます。
おそらく、Key-Offが正しく動作していないことが原因と考えられます。
修正方法を教えて下さい。

間違いがあるとすれば、soundplayerかYM2203のどちらかです。
368 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/05(土) 00:11:04.12 ID:oCbOGloR.net: 助けて！
369 ：デフォルトの名無しさん：2015/12/05(土) 01:29:56.55 ID:mqxGrt9y.net: >>368 コンパイラがエラーを出した@VC2012
soundplayer.h(101) : error C2864: 'VskPhrase::m_goal' : static const int データメンバー以外をクラス内で初期化することはできません
soundplayer.h(102) : error C2864: 'VskPhrase::m_buffer' : static const int データメンバー以外をクラス内で初期化することはできません
soundplayer.h(103) : error C2864: 'VskPhrase::m_source' : static const int データメンバー以外をクラス内で初期化することはできません
soundplayer.h(130) : error C2660: 'std::vector<_Ty>::emplace_back' : 関数に 7 個の引数を指定できません。
ていうか、このスレで良いのかな？
370 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/05(土) 01:31:25.73 ID:oCbOGloR.net: 報酬はアマ券15000円なり。ふるってどうぞ。
371 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/05(土) 01:33:37.45 ID:oCbOGloR.net: >>369
IDE古くね？少なくともC++11コンパイラーぐらいじゃないと
372 ：デフォルトの名無しさん：2015/12/05(土) 09:20:41.26 ID:+JNdeu9m.net: >>371
なら先にそう書いとけ
オリジナル版が2003年？なのに何ですっ飛んでるんだｗ
373 ：デフォルトの名無しさん：2015/12/05(土) 17:07:48.22 ID:fBRM/5tN.net: >>371
>>359からYM2203クラスに変更を加えてないならおそらくYM2203は大丈夫
あとは気が向いたら調査する。

プログラムとは関係ないけど音色のパラメーターは大丈夫？
音色のリリースタイムが長い場合、音がなかなか切れずに言ってるような現象になるかも。

それから人に聞くなら情報を的確に。
374 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/05(土) 18:00:03.86 ID:oCbOGloR.net: >>373
フルートの音色が選択されているが、これはCMD VOICE COPYで取得したのと
同一であることを確認した。だから音色のパラメーターは間違っていない。
間違ってるとすれば他のパラメーターかもしれない。
YM2203については、YM2203のnote_on,note_offメソッドをkey_on,key_offに改名した以外は
大きな変更はない。
375 ：デフォルトの名無しさん：2015/12/05(土) 20:38:36.12 ID:fBRM/5tN.net: >>374
簡単な切り分けを

main関数 317～356行目をコメントアウトして
Cの音のみ(「phrase->add_note('C');」のみ)を鳴らすようにしたらどうなる？

音が鳴り続ける？鳴っては止まって鳴っては止まってを繰り返す？

それからVskPhrase::realize関数内で確保してる配列dataは0で初期化しなくて大丈夫？
376 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/05(土) 22:20:36.98 ID:oCbOGloR.net: >>375
有り難う。mixの直前にmemsetを追加すると音が切れるようになった。
報酬が欲しければメールで連絡してくれ。
CLOCKは4000000のようだ。LFOはまだ働いていない。
377 ：デフォルトの名無しさん：2015/12/05(土) 22:58:24.14 ID:fBRM/5tN.net: メールで連絡って偽物だったらどうするの…？

報酬はいらんから少しマナーをわきまえてね
学生の頃 Cの勉強でお世話になったのにちょっと幻滅
378 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/05(土) 22:58:24.57 ID:oCbOGloR.net: LFOとwaveformのレジスタがわからん。
379 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/06(日) 13:56:32.76 ID:7Za5T0R3.net: FM音源のLFO設定がわからない
http://teratail.com/questions/21704

OpenAL + ALUTと、ciscさんのFM音源「FM Sound Generator」を使って、
自作のBASIC環境用の音を実現しようとしています。
http://github.com/katahiromz/fmgon/blob/master/soundplayer.cpp
http://github.com/katahiromz/fmgon
UFOが遠ざかる音色（@16）で、カエルの歌を演奏するプログラムですが、
LFOが設定されていないので、音にひずむようなエコーがかかっていません。
音源に対してこの音色のLFOを設定する方法を教えて下さい。
380 ：デフォルトの名無しさん：2015/12/06(日) 14:37:08.73 ID:4/ehRKm1.net: FM Sound Generatorの使い方なら最初の質問みたいに作者に聞けば？
381 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/06(日) 14:41:48.80 ID:oZIU0x1K.net: >>380
作者から返事が来ない(泣
382 ：デフォルトの名無しさん：2015/12/06(日) 18:45:17.06 ID:08bZjbf4.net: 実機でもエミュレータでもいいから「正解の音」を録音してどこかに置いておけば
より多くの人から返事をもらえる可能性があるかもしれないなあ、と思ったよ。（ひとりごと）
383 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/07(月) 13:21:15.04 ID:vUUH5oSb.net: >>382
ファイル名：cmd_voice.zip
パスワード：passpass
http://drive.google.com/uc?export=view&id=0B3nA8ShVAS4OOEFTUWZGN3RtU3M
384 ：デフォルトの名無しさん：2015/12/07(月) 15:47:38.89 ID:KuRdWB2c.net: パフパフニャーニャー
パフパフニャーニャー
385 ：デフォルトの名無しさん：2015/12/07(月) 22:39:51.16 ID:yUJmRPdi.net: R11からR13
386 ：片山博文MZ ◆T6xkBnTXz7B0 ：2015/12/09(水) 00:38:04.46 ID:1u+HKFL5.net: >>385
詳しくお願いします。
387 ：デフォルトの名無しさん：2016/02/21(日) 16:56:45.60 ID:8kkxo0DR.net: ホス
388 ：デフォルトの名無しさん：2016/03/29(火) 08:42:58.29 ID:/c8bAcK4.net: サッカーブッシュ日本代表日程ぷあたん（しゅっちょうまいくろ教育長交代）春文執行40代売上差額シュガーチョコ
https://www.youtube.com/watch?v=NDq1QoJY0nY宇ドナルドアナリストパワーストーンコーチングとしまえん
サッカーブッシュ日本代表日程古本屋よしたけしゅっちょうちょこしゅがー
ディーラー税務署天才開発者死亡詰みヨミドクターマイクロサービス不足
サッカーブッシュ日本代表日程ぷあたんシフト光金さかい強制バイト人権侵害問題
春分資源執行ニューヨーク低原価ぼったステーキソルトレイク福岡横浜新橋奴隷課金パチシフト強制バイト問題新潟米センター生残
コスメ２４チャリティー隠れ40代生活保護プレイボーイバイトレードいたりあん接待問題
マスコミKARDローンケーオーサービス不足婚活パーティー寄付金執行原発ビジネス
FBIチャイニーズタイホテル売上事務所ガチャ決算ガチャキャンペーン（販売報道陣過激派組織向携帯最新情報提供終了
校長発言細心注意ノートン産廃エラー(著作権クレーム中国反応融資高額教育費)(中国捕鯨団体40代社員サッカーコメント
高額入学金ヤフウ新橋大学ヤフウ新橋理事長FX経費おじや50代資産ガリバズフィード40代エリート
389 ：片山博文MZ ◆T6xkBnTXz7B0 ：2016/04/08(金) 19:07:37.41 ID:eaIwZ6It.net: https://github.com/katahiromz/WinVoice

アンパンマン、新しい顔ができたよ！
390 ：デフォルトの名無しさん：2016/05/30(月) 14:58:42.21 ID:lmnfFsu1.net: 概出だったらすまそ
https://dev.smt.docomo.ne.jp/?p=docs.api.page&api_name=text_to_speech&p_name=api_usage_scenario

総レス数 390
81 KB

掲示板に戻る全部前100 次100 最新50

read.cgi ver 2014.07.20.01.SC 2014/07/20 D ★