<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Podcast on デジタルアーカイブシステムの技術ブログ</title><link>https://tech.ldas.jp/ja/tags/podcast/</link><description>Recent content in Podcast on デジタルアーカイブシステムの技術ブログ</description><generator>Hugo</generator><language>ja</language><lastBuildDate>Thu, 30 Apr 2026 06:00:00 +0900</lastBuildDate><atom:link href="https://tech.ldas.jp/ja/tags/podcast/index.xml" rel="self" type="application/rss+xml"/><item><title>ElevenLabs v2 と v3 の日本語朗読品質比較 — 自分の声を学習させた合成音声による A/B 検証</title><link>https://tech.ldas.jp/ja/posts/elevenlabs-v3-japanese-tech-narration/</link><pubDate>Thu, 30 Apr 2026 06:00:00 +0900</pubDate><guid>https://tech.ldas.jp/ja/posts/elevenlabs-v3-japanese-tech-narration/</guid><description>&lt;blockquote>
&lt;p>本記事は生成AIと共同で執筆しています。事実関係は可能な範囲で公式ドキュメント等と照合していますが、誤りが含まれている可能性があります。重要な判断を行う前にご自身でも一次情報をご確認ください。&lt;/p>&lt;/blockquote>
&lt;p>技術ブログの記事を、自分の声を学習させた合成音声で朗読させる実験を行いました。音声合成は &lt;a href="https://elevenlabs.io/">ElevenLabs&lt;/a> の Voice Cloning + v3 モデル(&lt;code>eleven_v3&lt;/code>、執筆時点では alpha)を利用しています。&lt;/p>
&lt;p>本記事では、同一原稿を v2 (&lt;code>eleven_multilingual_v2&lt;/code>) と v3 で合成して並べた A/B サンプルと、運用上の観察を記録します。&lt;/p>
&lt;p>副次的に、生成した朗読音声をカバー画像 + 波形オーバーレイの MP4 として YouTube にも置いており、&lt;a href="https://www.youtube.com/playlist?list=PLuu5rEqJKB_93muUiPbXaXejRL1WNlJQJ">専用のプレイリスト&lt;/a>にまとめています。&lt;/p>
&lt;h2 id="背景">背景&lt;/h2>
&lt;p>背景として、特定の人物の声や話し方を AI で再現し、その人物が書き残したテキストやインタビュー記録を、本人らしい音声で読み上げ・対話する、といった取り組みへの関心があります。歴史人物や故人をデジタルアーカイブする文脈でこうした試みが進められており、技術的・倫理的な検証材料を、自分自身で手を動かして集めたいと考えました。&lt;/p>
&lt;p>ただし、他者の声を扱うのは権利・同意・倫理の観点から慎重であるべきなので、まずは自分自身の声で同じパイプラインを通し、合成品質・運用コスト・留意点を整理する、という自己実験を先に行うことにしています。&lt;/p>
&lt;h2 id="実験パイプライン">実験パイプライン&lt;/h2>
&lt;div class="highlight">&lt;pre tabindex="0" class="chroma">&lt;code class="language-text" data-lang="text">&lt;span class="line">&lt;span class="cl">記事 (Markdown)
&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="cl"> ↓ 朗読原稿 (.txt) に書き起こし (現時点では Claude Code で半手動)
&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="cl"> ↓ ElevenLabs API (eleven_v3) で MP3 合成
&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="cl"> ↓ Pillow でカバー画像 (1920x1080) を生成
&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="cl"> ↓ ffmpeg で静止画 + 音声 + showfreqs バー → MP4
&lt;/span>&lt;/span>&lt;span class="line">&lt;span class="cl"> ↓ YouTube Data API で公開 + 専用プレイリスト + タグ別 PL 登録
&lt;/span>&lt;/span>&lt;/code>&lt;/pre>&lt;/div>&lt;p>音声のみのカバーは見た目が単調になりやすいので、ffmpeg の &lt;code>showfreqs&lt;/code> フィルタで音声波形バーを下部にオーバーレイしています。&lt;/p></description></item></channel></rss>