インプレス[コンピュータ・IT]ムック Pythonで学ぶ画像生成 機械学習実践シリーズ
インプレス / 2025年03月25日 / 全367ページ
近年の技術の発展により、画像生成技術はますます身近になっています。「Midjouney」や「DALL・E2」のほか、特に2022年の「StableDiffusion」公開後、テキスト入力に基づく(text-to-image)画像生成AIのブームがさらに加速しています。本書は、今後幅広い分野に応用されうる技術として期待の「画像生成」について、画像生成に関する深層学習技術の基礎と、拡散モデルに焦点を当てて理論と実践を学ぶことを目的としています。
目次
- 本書の前提
- 目次
- 序章
- 第1章 画像生成とは?
- 第1節 画像生成の概要
- 第2節 テキストからの画像生成
- 第3節 画像生成技術の進歩による弊害
- コラム:すべてを救うPythonの型ヒント
- 第2章 深層学習の基礎知識
- 第1節 深層学習の概要
- 第2節 深層学習の訓練と評価
- 第3節 注意機構とTransformerモデル
- コラム:dataclassで万物に型を付けよう
- 第3章 拡散モデルの導入
- 第1節 生成モデル
- 第2節 DDPM(ノイズ除去拡散確率モデル)
- 第3節 スコアベース生成モデル
- 第4節 拡散モデルの生成品質の向上
- コラム:Pythonのコードを美しく保つには
- 第4章 潜在拡散モデルとStable Diffusion
- 本書の前提
- 目次
- 序章
- 第1章 画像生成とは?
- 第1節 画像生成の概要
- 第2節 テキストからの画像生成
- 第3節 画像生成技術の進歩による弊害
- コラム:すべてを救うPythonの型ヒント
- 第2章 深層学習の基礎知識
- 第1節 深層学習の概要
- 第2節 深層学習の訓練と評価
- 第3節 注意機構とTransformerモデル
- コラム:dataclassで万物に型を付けよう
- 第3章 拡散モデルの導入
- 第1節 生成モデル
- 第2節 DDPM(ノイズ除去拡散確率モデル)
- 第3節 スコアベース生成モデル
- 第4節 拡散モデルの生成品質の向上
- コラム:Pythonのコードを美しく保つには
- 第4章 潜在拡散モデルとStable Diffusion
- 第1節 LDM(潜在拡散モデル)
- 第2節 CLIP
- 第3節 Stable Diffusionを構成する要素
- 第4節 Stable Diffusion v1
- 第5節 Stable Diffusion v2
- 第6節 Stable Diffusion XL
- 第7節 Stable Diffusion v3
- コラム:深層学習を用いた実験を再現可能にするために気をつけること
- 第5章 拡散モデルによる画像生成技術の応用
- 第1節 パーソナライズされた画像生成
- 第2節 制御可能な画像生成
- 第3節 拡散モデルによる画像編集
- 第4節 画像生成モデルの学習および推論の効率化
- 第5節 学習済み拡散モデルの効果的な拡張
- 第6節 生成画像の倫理・公平性
- コラム:diffusersのコードを拡張する
- 第6章 画像生成の今後
- 第1節 拡散モデルの発展に伴う議論
- 第2節 拡散モデルによる画像生成の倫理
- 第3節 画像生成にとどまらない拡散モデルの進化と今後
- コラム:Hugging Faceのエコシステムを使い倒す
- 参考文献
- 索引
- 著者プロフィール
- 奥付
※このデジタル雑誌には目次に記載されているコンテンツが含まれています。それ以外のコンテンツは、本誌のコンテンツであっても含まれていません のでご注意ください。
※電子版では、紙の雑誌と内容が一部異なる場合や、掲載されないページがある場合があります。