| タイトル |
-
ja
半導体レーザネットワークの遅延カオス同期を用いた強化学習と意思決定
|
| 作成者 |
-
-
ja
巳鼻, 孝朋
ja-Kana
ミハナ, タカトモ
|
| アクセス権 |
open access |
| 内容注記 |
-
Other
xxi, 229p
-
Other
ja
概要 i
目次 v
図目次 xi
表目次 xxi
第 1 章 はじめに 1
1.1 背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 目的. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 本論文の構成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
第 2 章 序論 7
2.1 多腕バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 競合バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 ソフトウェアアルゴリズム. . . . . . . . . . . . . . . . . . . . . . . 9
2.3.1 ε-greedy 法. . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.2 Softmax 法. . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.3 Upper confidence bound (UCB) 法. . . . . . . . . . . . . . 10
2.3.4 綱引き理論. . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.3.5 綱引きボンベ理論. . . . . . . . . . . . . . . . . . . . . . . . 14
2.4 光を用いた意思決定の実装. . . . . . . . . . . . . . . . . . . . . . . 16
2.4.1 単一光子を用いた実装. . . . . . . . . . . . . . . . . . . . . 16
2.4.2 半導体レーザカオスを用いた意思決定. . . . . . . . . . . . 26
2.4.3 リングレーザを用いた実装. . . . . . . . . . . . . . . . . . . 32
2.5 意思決定の応用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.5.1 意思決定を利用した無線チャネル選択. . . . . . . . . . . . 35
2.5.2 リザーバコンピューティングと組み合わせたモデル選択. . 36
2.6 レーザカオス. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6.1 Lorenz-Haken 方程式. . . . . . . . . . . . . . . . . . . . . . 39
2.6.2 戻り光を有する半導体レーザのレート方程式. . . . . . . . . 42
2.7 低周波不規則振動. . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.7.1 低周波不規則振動の性質. . . . . . . . . . . . . . . . . . . . 49
2.7.2 低周波不規則振動と定常解. . . . . . . . . . . . . . . . . . . 51
2.8 レーザカオスによる同期現象. . . . . . . . . . . . . . . . . . . . . 59
2.8.1 遅延カオス同期とリーダ・ラガード関係. . . . . . . . . . . 59
2.8.2 ゼロ遅延同期とクラスタ同期. . . . . . . . . . . . . . . . . 63
第 3 章 レーザネットワークの数値計算モデルと定常解 71
3.1 リング状に一方向結合された半導体レーザのモデルとレート方程式 71
3.2 リング状に一方向結合された半導体レーザの定常解. . . . . . . . . 74
3.2.1 定常解の導出. . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.2.2 定常解の数値計算. . . . . . . . . . . . . . . . . . . . . . . . 77
3.3 ローパスフィルタの設計. . . . . . . . . . . . . . . . . . . . . . . . 80
3.4 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
第 4 章 レーザネットワークのダイナミクスの数値計算 85
4.1 戻り光を有する半導体レーザのダイナミクス調査. . . . . . . . . . 85
4.1.1 規格化注入電流が1.1 の場合. . . . . . . . . . . . . . . . . . 88
4.1.2 規格化注入電流が2.0 の場合. . . . . . . . . . . . . . . . . . 96
4.2 相互結合された半導体レーザのダイナミクス調査. . . . . . . . . . 101
4.2.1 規格化注入電流j が1.1 の場合. . . . . . . . . . . . . . . . . 102
4.2.2 規格化注入電流j が2.0 の場合. . . . . . . . . . . . . . . . . 108
4.3 リング状一方向結合された3 台の半導体レーザネットワークのダイナミクス調査. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
4.3.1 規格化注入電流j が1.1 の場合. . . . . . . . . . . . . . . . . 114
4.3.2 規格化注入電流が2.0 の場合. . . . . . . . . . . . . . . . . . 120
4.4 レーザネットワークによる2 次元分岐図の比較. . . . . . . . . . . . 125
4.5 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
第 5 章 相互結合された半導体レーザを用いた多腕バンディット問題における意思決定 131
5.1 相互結合された半導体レーザのレート方程式. . . . . . . . . . . . . 131
5.2 相互結合された半導体レーザにおける短時間相互相関値とリーダの定義. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
5.3 2 台のスロットマシンにおける意思決定. . . . . . . . . . . . . . . . 141
5.4 平均正答率を用いた意思決定の評価. . . . . . . . . . . . . . . . . . 143
5.4.1 平均正答率. . . . . . . . . . . . . . . . . . . . . . . . . . . 143
5.4.2 平均当たり確率. . . . . . . . . . . . . . . . . . . . . . . . . 143
5.4.3 本方式による意思決定と評価. . . . . . . . . . . . . . . . . 144
5.5 パラメータ変化による性能評価. . . . . . . . . . . . . . . . . . . . 147
5.5.1 相互結合された半導体レーザの結合強度による性能評価. . 147
5.5.2 意思決定のサンプリング間隔による性能評価. . . . . . . . . 152
5.5.3 綱引き理論の結合強度差のステップ数V による性能評価. . 154
5.6 UCB1 方策との比較. . . . . . . . . . . . . . . . . . . . . . . . . . . 157
5.7 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
第 6 章 半導体レーザネットワークを用いた多腕バンディット問題における意思決定 161
6.1 3つの半導体レーザによるリング状に一方向結合されたレーザネットワークのレート方程式. . . . . . . . . . . . . . . . . . . . . . . . . 161
6.2 レーザネットワークにおける短時間相互相関値とリーダの定義. . . 164
6.3 3台のスロットマシンにおける意思決定. . . . . . . . . . . . . . . . 175
6.3.1 遅延カオス同期を用いた意思決定方式. . . . . . . . . . . . 175
6.3.2 2台のスロットマシンの綱引き理論との式の等価性. . . . . 176
6.3.3 1サイクルの意思決定と平均正答率を用いた統計的評価. . . 178
6.3.4 パラメータによる意思決定の性能変化. . . . . . . . . . . . 180
6.4 4台のスロットマシンにおける意思決定とスロットマシンの配置依存性 183
6.5 n台のスロットマシンに対する意思決定とスケーラビリティ. . . . 188
6.6 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
第 7 章 半導体レーザネットワークを用いた競合バンディット問題における意思決定 191
7.1 競合バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 191
7.2 レーザネットワークを用いた競合バンディット問題の意思決定への実装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.2.1 多腕バンディット問題の解法を用いた実装. . . . . . . . . . 193
7.2.2 綱引きボンベ理論を用いた実装. . . . . . . . . . . . . . . . 195
7.2.3 改良綱引きボンベ理論を用いた実装. . . . . . . . . . . . . . 196
7.3 平均正答率と非選択衝突率による意思決定の評価. . . . . . . . . . 199
7.3.1 綱引き理論における統計的評価. . . . . . . . . . . . . . . . 200
7.3.2 綱引きボンベ理論における統計的評価. . . . . . . . . . . . 200
7.3.3 改良綱引きボンベ理論における統計的評価. . . . . . . . . . 201
7.4 問題設定による性能変化. . . . . . . . . . . . . . . . . . . . . . . . 202
7.5 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
第 8 章 結論 207
謝辞 211
公表論文 213
参考文献 219
-
Other
ja
指導教員 : 内田淳史教授
-
Other
text
-
Other
application/pdf
|
| 出版者 |
ja
埼玉大学大学院理工学研究科
en
Graduate School of Science and Engineering, Saitama University
|
| 日付 |
Issued2022-03
,
Created2023-01-26
|
| 言語 |
|
| 資源タイプ |
doctoral thesis |
| 出版タイプ |
VoR |
| 資源識別子 |
DOI
https://doi.org/10.24561/00019787
,
URI
https://sucra.repo.nii.ac.jp/records/19818
|
| ID |
|
| 収録誌情報 |
-
ja
博士論文(埼玉大学大学院理工学研究科(博士後期課程))
-
|
| 学位情報 |
-
学位授与番号
博理工甲第1242号
-
学位授与機関
-
識別子名
kakenhi
-
識別子
12401
-
機関名称
埼玉大学
-
学位授与年月日
2022-03-24
-
学位名
博士(工学)
|
| ファイル |
|
| コンテンツ更新日時 |
2026-01-17 |