

ベイズモデルによるテキスト分析の理論と実践:LDAからkeyATMまで
概要
トピックモデルを用いたテキストデータの構造抽出の数理的基礎を学びます
LDAおよびkeyATMのモデル構造とベイズ推論に基づく理論的背景を理解します
実際のデータを用いた分析を通して、実践的な適用方法と注意点を習得します詳細
本セミナーでは、テキストデータの中に潜む潜在構造(=トピック)を、確率的生成モデルの視点から抽出するトピックモデルについて解説します。特に、ベイズ統計に基づいた「潜在的ディリクレ配分法(Latent Dirichlet Allocation, LDA)」の仕組みを取り上げ、モデルの数理的構造とGibbsサンプリングを中心とした推論方法を学びます。さらに、LDAの発展的モデルである「Keyword Assisted Topic Model(keyATM)」を紹介し、事前に指定されたキーワード情報を活用することでトピックの意味的解釈を高める手法について、理論と実装の両面からアプローチします。後半では、Rを用いた分析デモを行い、パッケージの使い方から出力結果の読み取り方までを丁寧に解説します。このセミナーでは、数式やモデルに関する基礎知識を活かしつつ、現実のテキストデータをいかにモデルに落とし込むか、という「実践的なネタ」と統計的モデリングの融合に焦点を当てて進行します。
キーワード:ベイズ統計、テキスト分析、トピックモデル、LDA、KeyATM
対象者
テキスト分析において理論と実装の両面から学びたいデータサイエンティスト
ベイズ統計の考え方をテキストデータに応用したい研究者・学生
トピックモデルの構造や意味解釈に関心がある応用研究者
講師プロフィール
佐々木 智也(ささき ともや)
取得学位:学士・修士(法学政治学)、Ph.D. in Political Science
職歴
2024年– データサイエンティスト(Netflix、カリフォルニア州ロスガトス)
2023年 インターン(実験・因果推論部門、Netflix、カリフォルニア州ロスガトス)
2018年 プレ・ドクター・リサーチフェロー(プリンストン大学、ニュージャージー州プリンストン)
2016年–2018年 リサーチフェロー(統計数理研究所、東京都立川市)
学歴
2024年 マサチューセッツ工科大学(MIT・マサチューセッツ州ケンブリッジ)
政治学博士号(Ph.D.)取得2016年 東京大学(東京都)
法学政治学修士号(M.A.)取得2014年 慶應義塾大学(東京都)
法学政治学学士号(B.A.)取得
領収書発行
領収書を希望の方は、下記よりお問い合わせください。なお、学割利用の方への領収書発行はいたしかねますので、予めご了承ください。https://seminar.no-spare.com/receipt
注意事項
本セミナーはZoom Webinarsを用いて開催いたします。
お申し込み後、弊社より本セミナーへのZoom参加用URLを開催当日までに送付いたします。
開催時間になりましたら、送付するURLよりご参加ください。
講義終了後からの受講申込や、講義途中からの申込およびライブ受講の欠席による返金は致しかねますので、予めご了承ください。
本セミナーにお申し込みいただいた方には、本セミナーのアーカイブ動画 講義資料 演習資料(演習のあるセミナーのみ)の3点を配布いたします。
お申し込み後、諸事情によりリアルタイムでのご参加が難しくなってしまった方にも、上記3点の資料を配布いたします。
アーカイブ配信期間は、セミナー終了より1ヶ月間です。
万が一、開催時間になっても事前案内メール(Zoomの参加URLや講義資料など)が届かない場合は、迷惑メールフォルダやゴミ箱に自動的に振り分けられている場合がございます。一度ご確認いただきますようお願い申し上げます。
参加URLはメールにてご案内いたします。no-spare.comドメインより受け取ることができるように設定をお願い申し上げます。
お問い合わせの際は、弊社コンタクトフォームよりお願い申し上げます。
禁止事項
録音や録画撮影などはご遠慮ください。
配布した一切の資料 / 動画を無断で公開、転載することは固く禁じます。
免責事項
本セミナーの内容は、事前の告知なく変更を行う場合があります。
主催者および講演者の諸般の事情や、天災地変その他の不可抗力の事態により、本セミナーの一部あるいは全部を中止させていただく場合があります。
弊社ドメインをブロックしていたことによりメールが受け取れなかったことによる参加の遅れや欠席などの責任は負いかねますので、ご了承ください。
上記が発生する場合は、当社から受講者に対して、本ページやSNS、電子メールなどで事前にお知らせいたします。ただし、事由によっては事前のお知らせがないことを予めご了承ください。