6.2. 調子タグの種類とフォーマット
以下のタグをサポートしています。(SSML※フォーマット相当ですが、非対応のタグがあり、一部の仕様も異なります。)
※ SSML (Speech Synthesis Markup Language) :XML標準に基づいた音声合成向けの記述言語
制御タグは、半角記号・半角英数字で適用する必要があります(“読み仮名”部分を除く)。正しい書式で記述されなかった場合、動作は保証されません。また、一般的なタグとしての書式が正しい場合でも(開始タグ、終了タグの対応関係が正しいなど)、本サービスでサポートしないタグは無視されます。
6.2.1. 強調
<emphasis level="値"> ~ </emphasis>
指定された範囲の語句を強調して発声させます。指定できる値は、以下の4種類です。
値 | 意味 |
---|---|
none |
強調なし(変化なし) |
moderate |
やや強く強調する |
strong |
非常に強く強調する |
reduced |
逆に弱める |
【使用例】
今日は<emphasis level="moderate">とても良い</emphasis>天気です。
6.2.2. 発声時間(話速)
<prosody rate="値"> ~ </prosody>
指定された範囲の語句の発声時間(話速)を変更します。値の設定方法は以下の3種類です。
種類 | 値 |
---|---|
倍率指定(符号なし) | 0.333 ~ 3.0 |
%単位での相対指定(符号あり) | -66% ~ +200% |
表現語による絶対指定 | x-slow ・・・かなり遅く(0.5)slow ・・・やや遅く(0.667)medium ・・・標準値(1.0)fast ・・・やや速く(1.333)x-fast ・・・かなり速く(2.0)default ・・・標準値(1.0) |
【使用例】
<prosody rate="1.333">時間がないので、少し早口でしゃべります。</prosody>
6.2.3. 声の高さ
<prosody pitch="値"> ~ </prosody>
指定された範囲の語句の声の高さを変更します。値の設定方法は以下の5種類です。
種類 | 値 |
---|---|
Hz単位での絶対指定(符号なし) | 1Hz ~ 32767Hz |
%単位での相対指定(符号あり) | -15.0% ~ +15.0% |
セミトーン(半音)単位での相対指定(符号必須) | -12.0st ~ +12.0st |
Hz単位での相対指定(符号必須) | -32768Hz ~ +32767Hz |
表現語による絶対指定 | x-low・・・かなり低く low・・・やや低く medium・・・変更なし high・・・やや高く x-high・・・かなり高く default・・・変更なし |
【使用例】
<prosody pitch="+10%">少し声を高くします.</prosody>
6.2.4. 抑揚の大きさ
<prosody range="値"> ~ </prosody>
指定された範囲の語句の抑揚の大きさ(声の高さの変化幅、ダイナミックレンジ)を変更します。値の設定方法は以下の2種類です。
種類 | 値 |
---|---|
%単位での相対指定(符号あり) | -100.0% ~ +50.0% |
表現語による絶対指定 | x-low・・・かなり小さく low・・・やや小さく medium・・・変更なし high・・・やや大きく x-high・・・かなり大きく default・・・変更なし |
【使用例】
<prosody range="-100%">抑揚のないロボット声です.</prosody>
6.2.5. 音量
<prosody volume="値"> ~ </prosody>
指定された範囲の語句の音量を変更します。値の設定方法は以下の4種類です。
※ 値を大きくしすぎると波形が振り切れてノイズが発生する可能性があります。
種類 | 値 |
---|---|
絶対指定(符号なし) | 0 ~ 100 |
表現語による絶対指定 | silent・・・無音(0) x-soft・・・かなり小さく(17) soft・・・やや小さく(33) medium・・・変更なし(50) loud・・・やや大きく(75) x-loud・・・かなり大きく(100) default・・・変更なし(50) |
【使用例】
ちょっと<prosody volume="+30">大きな声で</prosody>しゃべります。
6.2.6. ポーズ
<break time="値"/> または <break strength="値"/>
指定された箇所にポーズを適用します。ポーズの長さ(time
)と区切りの強さ(strength
)を別々に指定できます。(どちらか一方だけの指定も可能です)
ポーズの長さ(time)の指定(2種類)
種類 | 値 |
---|---|
ミリ秒単位の絶対指定(符号なし) | 0ms ~ 65535ms |
秒単位の絶対指定(符号なし) | 0s ~ 65.535s |
区切りの強さ(strength)の指定
種類 | 値 |
---|---|
none・・・なし x-weak・・・かなり弱く weak・・・やや弱く medium・・・ふつう strong・・・やや強く x-strong・・・かなり強く |
【使用例】
ここで<break time="2000ms"/>ちょっと長めのポーズを入れてみました。
6.2.7. 読み
<phoneme ph="読み調整テキスト"> ~ </phoneme>
語句の読みを指定します。読みがな、アクセント位置、および区切りを「読み調整テキスト」(制御タグ除く)で記述します。
※ このタグは、「入力テキスト」に対してのみ有効です。
【使用例】
文脈なしで、<phoneme ph="シジョート">市場と</phoneme><phoneme ph="イ'チバオ">市場を</phoneme>読み分けることは、人間でもできません。
6.2.8. ルビ
<phoneme alphabet="x-toshiba-ruby" ph="文字列"> ~ </phoneme>
文字列(単語の一部でも可)の読みがなを指定します。アクセント位置は自動的に推定されます。
※ このタグは、「入力テキスト」に対してのみ有効です。
【使用例】
一人の<phoneme alphabet="x-toshiba-ruby" ph="げにん">下人</phoneme>が、羅生門の下で雨やみを待っていた。
6.2.9. 読み方
<say-as interpret-as="種類" format="フォーマット"> ~ </say-as>
語句の読み方を指定します。以下のような4種類の読み方が指定できます。また、 date
(日付読み)と time
(時刻読み)については、読み方の詳細をフォーマットで指定できます。(フォーマットの指定は省略することも可能です)
※ このタグは、「入力テキスト」に対してのみ有効です。
種類 | フォーマット |
---|---|
date (日付読み) |
省略(=ymd) md mdy dmy ym my dm md y (y: 年、m: 月、d: 日を意味します。) |
time (時刻読み) |
省略(=hms24) hms24 hm (h: 時、m: 分、s: 秒を意味します。) |
telephone (電話番号読み) |
- |
characters (アルファベット読み&数字棒読み) |
- |
【使用例】
<say-as interpret-as="date" format="mdy">10/08/2013</say-as> は、
平成<say-as interpret-as="date" format="y">25</say-as>です。
Speakの綴りは、<say-as interpret-as="characters">Speak</say-as>です。
6.2.10. ローマ字読み
<roman> ~ </roman>
指定された範囲をローマ字読みします。
※ このタグは、「入力テキスト」に対してのみ有効です。
【使用例】
I went to <roman>Shibuya</roman>.
6.2.11. 言語指定
<voice xml:lang="en-US"> ~ </voice>
指定された範囲の言語を指定します。
※ 現在のところ、中国語(北京語・広東語)の中で米語を読む用途でのみサポートされています。
【使用例】
检索:到附近的 <voice xml:lang="en-US">Seven Eleven</voice>