東北大学情報科学研究科LECTUERS

講演会・セミナーなど

HOME › 講演会・セミナーなど

青葉山統計科学セミナー

今後の予定



第11回 根元 多佳子「統計的仮説検定と論理」

日時 : 2024年7月31日(水)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟711演習室
講演者 : 根元 多佳子(東北大学情報科学研究科)
タイトル : 統計的仮説検定と論理
概要 : 背理法とは、「『Aでない』を仮定すると矛盾が導出されるならば、Aである」という論法である。背理法を用いて導出される命題には例えば、「上に有界な実数の集合には上限がある」などがある。一方、統計的仮説検定では、帰無仮説の棄却は次の推論に基づいて行われる。
1. 検定統計量が棄却域に属する
2. 高確率で対立仮説が成立する
3. 高確率で帰無仮説は成立しない
このことから、仮説検定を「危険率付きの背理法である」と説明する入門書もあるが、論理学の観点からみてこれは妥当だろうか?また、よりよく仮説検定を説明できる論理は構成できるだろうか?本講演ではこれらの点について検討する。尚、本講演内容は大森仁准教授との議論によるものである。

第12回 藤原 直哉

日時 : 2024年8月30日(金)16:00 ~ 17:00
講演者 : 藤原 直哉(東北大学情報科学研究科)

過去の活動

第1回 坂田 綾香「グループテストにおける推論と最適カットオフ評価」

日時 : 2024年2月8日(木)16:00 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟711演習室
講演者 : 坂田 綾香(統計数理研究所 数理・推論研究系)
タイトル : グループテストにおける推論と最適カットオフ評価
概要 : グループテストは、複数のアイテムを同時に検査することで検査回数を減らしつつ、アイテムの状態(欠陥の有無)を推定する手法である。 一般に未知変数の数よりも観測(検査)数が少ない設定を扱うため、欠陥の推定は劣決定問題であるが欠陥アイテム数が十分小さいというスパース性仮定のもとでは、欠陥の有無を一意に同定できる場合がある。 今回の発表では、ノイズのあるグループテストにおける推論問題に焦点を当て、意思決定理論の観点から欠陥アイテムを特定する手法について紹介する。

第2回 松田 安昌「東京賃貸市場の時空間分析」

日時 :2024年2月14日(水)16:00 ~ 17:00
場所 : 東北大学大学院情報科学研究科棟2階中講義室
講演者 : 松田 安昌(東北大学経済学部)
タイトル : 東京賃貸市場の時空間分析(松田安昌, 込山湧士)
概要 : 東京23区賃貸市場のビッグデータをもちいて流動性、価格弾力性を評価し、コロナ禍期間前後の変動から東京賃貸市場の特徴を明らかにすることを目的とする。 賃貸市場ビッグデータは、2019年から2021年までの約3年間にわたる賃貸取引の詳細を含み、物件の特徴量(賃料、広さ、階数、その他)及びweb広告初掲載の日時と掲載終了日時が記録される。 本報告では、掲載開始日から終了日までを生存時間と考え、Cox回帰モデルを基本にニューラルネットで非線形に拡張した時空間モデルを提案する。 分析結果はまだ未完で、途中経過の報告となります。生存時間分析のレビューからはじめる予定です。

第3回 西郷 甲矢人「圏上の非可換確率空間:確率構造と因果構造の融合」

日時 : 2024年2月22日(木)15:30 ~ 16:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 西郷 甲矢人(長浜バイオ大学)
タイトル : 圏上の非可換確率空間:確率構造と因果構造の融合
概要 : 非可換確率空間は測度論的確率空間の一般化であり、量子論の数理的基盤でもある。 一方、因果構造の一般的取り扱いにおいて近年圏論的な枠組みが注目され始めている。 講演者は量子論(非可換確率構造)と相対論(因果構造)の融合である量子場の数理の 基盤として用いるためにこの概念を定義・研究してきたが、認知のモデル化や因果推論にもその応用が広がる可能性も見えてきた。基礎理論のみならず応用への可能性にも重点を置きながら、今後の展望を含めて議論したい。

第4回 安齋 達彦「COVID-19流行下の自殺死亡数変動評価における統計モデルの活用」,
   高橋 邦彦「疾病地図と空間疫学研究におけるデータ分析」

日時 : 2024年3月21日(木)15:00 ~ 17:10
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者1 : 15:00~16:00 安齋 達彦(東京医科歯科大学 M&Dデータ科学センター)
タイトル : COVID-19流行下の自殺死亡数変動評価における統計モデルの活用
概要 : 新型コロナウイルス感染症(COVID-19)流行下には社会状況の大きな変化があり、日本では感染初期から自殺者の増加が懸念されていた。 一般に感染症流行による健康影響を評価するために、感染症が流行していない状況下で想定される死亡数の期待値と実際の観測値との差を表わす「超過死亡」が一つの指標として用いられることがあるが、 講演者らは日本国内での自殺による死亡に着目し、その超過死亡の動向から自殺死亡数の変動を評価し、さらにCOVID-19流行期間内における社会状況の変化と自殺死亡数の増減の関係性などについていくつか分析を行い発表してきた。 本発表では、これらの自殺死亡数の変動に関する疫学的検討を通して、その評価における統計モデルの活用について議論したい。

講演者2 : 16:10~17:10 高橋 邦彦(東京医科歯科大学 M&Dデータ科学センター)
タイトル : 疾病地図と空間疫学研究におけるデータ分析
概要 : あるデータに対してその位置情報を付加したデータは空間データとよばれ、近年その利活用が進んできている。 空間データを扱うことで、従来のデータによる「どのくらい」という量だけではなく、「どこに、どのくらい」という情報を得ることができ、 特に疾病発生をはじめとする健康関連分野における地域的な分布を分析する空間疫学では中心的なデータとなり、またそれを視覚化するための疾病地図も身近になってきている。 本講演では空間疫学における代表的な統計モデルや分析の概要とともに、感染症の発生や突発的な事象の発生を早期発見する際に利用されるクラスタ検出法として、講演者らが提案する疾病集積性の検定法とその応用について紹介する。

第5回 内藤 貫太「多次元空間における埋め込み1次元曲線の同時信頼領域」

日時 : 2024年5月8日(水)16:00 ~ 17:00
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 内藤 貫太(東北大学大学院情報科学研究科)
タイトル : 多次元空間における埋め込み1次元曲線の同時信頼領域
概要 : 多次元空間に埋め込まれた1次元曲線の推測に関して考察を与える。 動機となるデータは、例えば生物種の多次元的な成長に着目した際に多く実在している。 このようなデータは多次元空間に埋め込まれた1次元曲線の周辺に存在するものとして理解すると都合が良い。 こういった多次元データから埋め込み1次元曲線の信頼領域を構築する方法については研究が少なく、特に“同時信頼領域”に関する研究は見当たらないようである。 本講演ではノンパラメトリック平滑化を用いて埋め込み1次元曲線の同時信頼領域を構築する方法について紹介する。 構築される信頼領域の理論的性質について議論を与える。 シミュレーション実験の結果および実データへの適用結果についても報告する。

第6回 大石 峰暉「ネットワーク Lasso の最適化について」

日時 : 2024年5月22日(水)17:00 ~ 18:00
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 大石 峰暉(東北大学データ駆動科学・AI教育研究センター)
タイトル : ネットワークLassoの最適化について
概要 : リッジ回帰やLassoに代表される罰則付き推定法は広く普及しており、特にLassoのような絶対値に基づく手法はその解が陽な形で得られないため、最適化問題を解くためのアルゴリズムが重要となる。 代表的なものとして座標降下法や交互方向乗数法が挙げられる。特に近年では、その汎用性の高さから交互方向乗数法が注目されているが、これが必ずしも良いとは限らない。 本発表ではネットワークLassoの最適化問題に着目し、これら2つのアルゴリズムを比較した結果について報告する。

第7回 山本 倫生「関数データ解析に基づくスパース観測データのクラスタリング」

日時 : 2024年6月12日(水)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 山本 倫生(大阪大学)
タイトル : 関数データ解析に基づくスパース観測データのクラスタリング
概要 : 離散的にデータが観測される経時測定データや空間データに対して、関数データ解析では個々のデータを関数化し、得られた関数をデータとして扱って解析を行うことが多い。 例えば、個体ごとの観測点や観測点数が異なるデータの場合、古典的な解析手法では扱いづらいことが多いが、関数データ解析では関数化処理により容易に解析することができる。 経時測定データにおける個体のクラスタリングにおいても、個体ごとに事前に平滑化を施し関数化することで適切に解析可能である。 一方で、経時測定データにおいて、個体ごとに少数の時点でしか測定値が得られない場合がしばしば生じるが、そのようなスパース観測データにおいては、単純な関数化処理ではその背後にあるクラスタ構造を推定することは困難である。 本発表では、まずは単純な関数化処理に基づくクラスタリング法や関連手法について紹介し、スパース観測データに対するシンプルなクラスタリング法の提案について説明する。
参考資料

第8回 吉本 敦「Landscape Ecology & Resoruce Managementを軸にした最適化モデルの展開」

日時 : 2024年6月19日(水)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 吉本 敦(統計数理研究所)
タイトル : Landscape Ecology & Resoruce Managementを軸にした最適化モデルの展開
概要 : 森林資源を取り巻く社会環境は過去数十年で大きく変化してきました。それに伴い、資源管理の意思決定を支援する最適化モデルも複雑化しています。 かつて木材生産を主目的として利用されてきた森林資源は、現在では野生動物の生息地などの森林生態系サービスを提供する資源として見直され、その管理の仕方も様々な時空間的な制約が課されるようになっています。 1980年代に導入された大面積皆伐を回避する隣接制約に続き、伐採後の緑化回復を狙った隣接緑化制約、隣接制約により細分化され過ぎた林分を逆に集約する最大伐採許容面積制約などが新たに考慮されるようになってきました。 最近では、小規模な保護区を拡張するためのバッファーゾーン形成や、分断された生息地をコリドーで連結するコリドー形成問題なども資源管理で考慮するようになり、Landscape EcologyとResource Managementを対象とした 最適化モデルが展開されています。これらの制約はしばしば連続的な伐採作業を分断し、環境保護活動と連動していますが、解の探求は非常に困難になっています。今回の発表では、これまでに構築してきた最適化モデルを紹介します。
参考資料 ➀
参考資料 ➁

第9回 黒木 学「“Probabilities of Causation”とその周辺の話題」

日時 : 2024年6月27日(木)16:30 ~ 18:00
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 黒木 学(横浜国立大学)
タイトル : “Probabilities of Causation”とその周辺の話題
概要 : 原因の究明は、統計的因果推論が取り組む問題階層のなかで最上位にランクされる、解決することが最も困難とされている問題である。 本発表では、原因の究明を行う際の重要な概念である原因の確率を取り上げ、その基本的な考え方を概説するとともに、時間が許す限り、講演者がこれまで行ってきた研究成果について紹介する。

第10回 服部 聡「推定方程式制約下での線形計画法による未観測交絡に対する感度解析法」

日時 : 2024年7月12日(金)16:30 ~ 17:45
場所 : 東北大学大学院情報科学研究科棟7階711セミナー室
講演者 : 服部 聡(大阪大学大学院 医学系研究科 医学統計学教室)
タイトル : 推定方程式制約下での線形計画法による未観測交絡に対する感度解析法
概要 : 無作為化試験はもっとも強固な医学的根拠を創出する試験デザインとして広く受け入れられているが、無作為化試験の実施には多大な費用と時間が掛かり、疾患レジストリーや電子カルテデータなどの既存データを有効活用する試みが、リアルワールドデータの名のもとに広く関心を集めている。 統計解析は観察研究の方法に則ることになり、交絡因子を適切に調整する必要がある。そのために傾向スコアによる解析が広く用いられている。傾向スコアによる解析を行う際に、傾向スコアで調整できない未観測交絡の問題が常に研究の限界として残される。 未観測交絡の潜在的な影響を評価する感度解析の方法が様々提案されているが、未観測な変数へのモデリングを含むため、何らかの検証不可能な仮定に依存せざるを得ず、解釈が容易でない。 本研究では、通常はパラメトリック傾向スコアの未知パラメータの推定に用いられる推定方程式を、傾向スコアが満たすべき制約ととらえ、推定方程式を制約とする線形計画法により未観測交絡の影響を評価する方法を提案する。 提案法は解釈困難な感度解析パラメータの設定を最小限にした上で、平均因果効果の上限と下限を与える。その範囲が十分に狭くない場合には、既存の方法のような制約を課して範囲を狭めることも可能であるが、既存法よりも狭い範囲を与えることが経験的に確認された。 また、このアイディアはメタアナリシスにおける公表バイアスの評価にも有用で、これまで困難であった公表バイアスのノンパラメトリックな上限評価のための簡明な方法を与えることができる。

Simon Wood教授 講演会

「Generalized Additive Modelling methods for two issues in health/epidemiology」

Simon Wood 教授(School of Mathematics, University of Edinburgh)
東北大学情報科学研究科数学教室【情報数理談話会】2023年3月6日
於:東北大学大学院情報科学研究科
要旨: Air pollution and Covid-19 offer two recent public health issues with significant worldwide impact. Statistical regression models constructed in terms of smooth functions of predictor variables - generalized additive models - can be very helpful in analyzing data arising in relation to both. This talk illustrates this with two case studies. The first is the modelling of 40 years worth of spatially references daily particulate air pollution data over the UK, with the aim of producing epidemiologically useful pollution burden estimates at different locations and times: the data contain some 10 million observations, and novel methods were required to deal with this data volume. The second case study concerns inference of the daily number of new Covid-19 infections from the clinical data available. GAM like models are useful, but some method extensions are needed to obtain the best possible reconstructions. Interestingly, in the UK context infections appear to have been in decline some time before each of the full stay-at-home lockdowns, with the timing of lockdown coinciding rather with an immediate rapid increase in deaths, which lag infections by several weeks.