半導体レーザネットワークの遅延カオス同期を用いた強化学習と意思決定

巳鼻 孝朋; ミハナ タカトモ

タイトル	ja 半導体レーザネットワークの遅延カオス同期を用いた強化学習と意思決定
作成者	ja 巳鼻, 孝朋 ja-Kana ミハナ, タカトモ
アクセス権	open access
内容注記	Other xxi, 229p Other ja 概要 i 目次 v 図目次 xi 表目次 xxi 第 1 章はじめに 1 1.1 背景. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 目的. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 本論文の構成. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 第 2 章序論 7 2.1 多腕バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 7 2.2 競合バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3 ソフトウェアアルゴリズム. . . . . . . . . . . . . . . . . . . . . . . 9 2.3.1 ε-greedy 法. . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.3.2 Softmax 法. . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.3.3 Upper confidence bound (UCB) 法. . . . . . . . . . . . . . 10 2.3.4 綱引き理論. . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.3.5 綱引きボンベ理論. . . . . . . . . . . . . . . . . . . . . . . . 14 2.4 光を用いた意思決定の実装. . . . . . . . . . . . . . . . . . . . . . . 16 2.4.1 単一光子を用いた実装. . . . . . . . . . . . . . . . . . . . . 16 2.4.2 半導体レーザカオスを用いた意思決定. . . . . . . . . . . . 26 2.4.3 リングレーザを用いた実装. . . . . . . . . . . . . . . . . . . 32 2.5 意思決定の応用. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.5.1 意思決定を利用した無線チャネル選択. . . . . . . . . . . . 35 2.5.2 リザーバコンピューティングと組み合わせたモデル選択. . 36 2.6 レーザカオス. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.6.1 Lorenz-Haken 方程式. . . . . . . . . . . . . . . . . . . . . . 39 2.6.2 戻り光を有する半導体レーザのレート方程式. . . . . . . . . 42 2.7 低周波不規則振動. . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 2.7.1 低周波不規則振動の性質. . . . . . . . . . . . . . . . . . . . 49 2.7.2 低周波不規則振動と定常解. . . . . . . . . . . . . . . . . . . 51 2.8 レーザカオスによる同期現象. . . . . . . . . . . . . . . . . . . . . 59 2.8.1 遅延カオス同期とリーダ・ラガード関係. . . . . . . . . . . 59 2.8.2 ゼロ遅延同期とクラスタ同期. . . . . . . . . . . . . . . . . 63 第 3 章レーザネットワークの数値計算モデルと定常解 71 3.1 リング状に一方向結合された半導体レーザのモデルとレート方程式 71 3.2 リング状に一方向結合された半導体レーザの定常解. . . . . . . . . 74 3.2.1 定常解の導出. . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.2.2 定常解の数値計算. . . . . . . . . . . . . . . . . . . . . . . . 77 3.3 ローパスフィルタの設計. . . . . . . . . . . . . . . . . . . . . . . . 80 3.4 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 第 4 章レーザネットワークのダイナミクスの数値計算 85 4.1 戻り光を有する半導体レーザのダイナミクス調査. . . . . . . . . . 85 4.1.1 規格化注入電流が1.1 の場合. . . . . . . . . . . . . . . . . . 88 4.1.2 規格化注入電流が2.0 の場合. . . . . . . . . . . . . . . . . . 96 4.2 相互結合された半導体レーザのダイナミクス調査. . . . . . . . . . 101 4.2.1 規格化注入電流j が1.1 の場合. . . . . . . . . . . . . . . . . 102 4.2.2 規格化注入電流j が2.0 の場合. . . . . . . . . . . . . . . . . 108 4.3 リング状一方向結合された3 台の半導体レーザネットワークのダイナミクス調査. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 4.3.1 規格化注入電流j が1.1 の場合. . . . . . . . . . . . . . . . . 114 4.3.2 規格化注入電流が2.0 の場合. . . . . . . . . . . . . . . . . . 120 4.4 レーザネットワークによる2 次元分岐図の比較. . . . . . . . . . . . 125 4.5 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 第 5 章相互結合された半導体レーザを用いた多腕バンディット問題における意思決定 131 5.1 相互結合された半導体レーザのレート方程式. . . . . . . . . . . . . 131 5.2 相互結合された半導体レーザにおける短時間相互相関値とリーダの定義. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 5.3 2 台のスロットマシンにおける意思決定. . . . . . . . . . . . . . . . 141 5.4 平均正答率を用いた意思決定の評価. . . . . . . . . . . . . . . . . . 143 5.4.1 平均正答率. . . . . . . . . . . . . . . . . . . . . . . . . . . 143 5.4.2 平均当たり確率. . . . . . . . . . . . . . . . . . . . . . . . . 143 5.4.3 本方式による意思決定と評価. . . . . . . . . . . . . . . . . 144 5.5 パラメータ変化による性能評価. . . . . . . . . . . . . . . . . . . . 147 5.5.1 相互結合された半導体レーザの結合強度による性能評価. . 147 5.5.2 意思決定のサンプリング間隔による性能評価. . . . . . . . . 152 5.5.3 綱引き理論の結合強度差のステップ数V による性能評価. . 154 5.6 UCB1 方策との比較. . . . . . . . . . . . . . . . . . . . . . . . . . . 157 5.7 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 第 6 章半導体レーザネットワークを用いた多腕バンディット問題における意思決定 161 6.1 3つの半導体レーザによるリング状に一方向結合されたレーザネットワークのレート方程式. . . . . . . . . . . . . . . . . . . . . . . . . 161 6.2 レーザネットワークにおける短時間相互相関値とリーダの定義. . . 164 6.3 3台のスロットマシンにおける意思決定. . . . . . . . . . . . . . . . 175 6.3.1 遅延カオス同期を用いた意思決定方式. . . . . . . . . . . . 175 6.3.2 2台のスロットマシンの綱引き理論との式の等価性. . . . . 176 6.3.3 1サイクルの意思決定と平均正答率を用いた統計的評価. . . 178 6.3.4 パラメータによる意思決定の性能変化. . . . . . . . . . . . 180 6.4 4台のスロットマシンにおける意思決定とスロットマシンの配置依存性 183 6.5 n台のスロットマシンに対する意思決定とスケーラビリティ. . . . 188 6.6 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 第 7 章半導体レーザネットワークを用いた競合バンディット問題における意思決定 191 7.1 競合バンディット問題. . . . . . . . . . . . . . . . . . . . . . . . . 191 7.2 レーザネットワークを用いた競合バンディット問題の意思決定への実装. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 7.2.1 多腕バンディット問題の解法を用いた実装. . . . . . . . . . 193 7.2.2 綱引きボンベ理論を用いた実装. . . . . . . . . . . . . . . . 195 7.2.3 改良綱引きボンベ理論を用いた実装. . . . . . . . . . . . . . 196 7.3 平均正答率と非選択衝突率による意思決定の評価. . . . . . . . . . 199 7.3.1 綱引き理論における統計的評価. . . . . . . . . . . . . . . . 200 7.3.2 綱引きボンベ理論における統計的評価. . . . . . . . . . . . 200 7.3.3 改良綱引きボンベ理論における統計的評価. . . . . . . . . . 201 7.4 問題設定による性能変化. . . . . . . . . . . . . . . . . . . . . . . . 202 7.5 まとめ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206 第 8 章結論 207 謝辞 211 公表論文 213 参考文献 219 Other ja 指導教員 : 内田淳史教授 Other text Other application/pdf
出版者	ja 埼玉大学大学院理工学研究科 en Graduate School of Science and Engineering, Saitama University
日付	Issued2022-03 , Created2023-01-26
言語	jpn
資源タイプ	doctoral thesis
出版タイプ	VoR
資源識別子	DOI https://doi.org/10.24561/00019787 , URI https://sucra.repo.nii.ac.jp/records/19818
ID	JaLC 10.24561/00019787
収録誌情報	ja 博士論文（埼玉大学大学院理工学研究科（博士後期課程））
学位情報	学位授与番号博理工甲第1242号学位授与機関識別子名 kakenhi 識別子 12401 機関名称埼玉大学学位授与年月日 2022-03-24 学位名博士(工学)
ファイル	fulltext GD0001437.pdf 19.5 MB (application/pdf) Available2023-01-26
コンテンツ更新日時	2026-01-17