東北大学情報科学研究科LECTUERS
講演会・セミナーなど
HOME › 講演会・セミナーなど
青葉山統計科学セミナー
今後の予定
-
日時 : 2024年11月25日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 島津 秀康(北里大学未来工学部 データサイエンス学科)
タイトル : 生物多様性の計量評価
概要 : 生物多様性の計量評価は生態学のみならず生態保全管理の側面からも重要な課題である。これまで様々な指標が提案され研究が進められてきたが、多様な指標が生物多様性を生み出している皮肉な側面も否めず、指標のより統一的な視点からの理解がカギとなる。 しかしながら、必ずしも統一的枠組みでの理解には至っていないのが現状のように思われる。本発表では、生態学の分野で伝統的に使われてきたα, β, γ 多様性といった生物多様性評価の指標を概観し、統計学的視点から種の個体数分布に基づく定式化を提案する。 分布の違いが生物多様性の変動を示す枠組みを導出し、生物多様性評価への有用性と展望を議論する。
第18回
-
日時 : 2024年12月9日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 中谷 友樹(東北大学環境科学研究科)
第19回
-
日時 : 2024年12月16日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階中講義室
講演者 : 岡田 彩(東北大学情報科学研究科)
第20回
-
日時 : 2025年1月14日(火)
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 和田 裕一(東北大学情報科学研究科)
第21回
-
日時 : 2025年1月27日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 成塚 拓真(立正大学データサイエンス学部)
第22回
過去の活動
-
日時 : 2024年2月8日(木)16:00 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟711演習室
講演者 : 坂田 綾香(統計数理研究所 数理・推論研究系)
タイトル : グループテストにおける推論と最適カットオフ評価
概要 : グループテストは、複数のアイテムを同時に検査することで検査回数を減らしつつ、アイテムの状態(欠陥の有無)を推定する手法である。 一般に未知変数の数よりも観測(検査)数が少ない設定を扱うため、欠陥の推定は劣決定問題であるが欠陥アイテム数が十分小さいというスパース性仮定のもとでは、欠陥の有無を一意に同定できる場合がある。 今回の発表では、ノイズのあるグループテストにおける推論問題に焦点を当て、意思決定理論の観点から欠陥アイテムを特定する手法について紹介する。
第1回
-
日時 :2024年2月14日(水)16:00 ~ 17:00
場所 : 東北大学大学院情報科学研究科棟2階中講義室
講演者 : 松田 安昌(東北大学経済学部)
タイトル : 東京賃貸市場の時空間分析(松田安昌, 込山湧士)
概要 : 東京23区賃貸市場のビッグデータをもちいて流動性、価格弾力性を評価し、コロナ禍期間前後の変動から東京賃貸市場の特徴を明らかにすることを目的とする。 賃貸市場ビッグデータは、2019年から2021年までの約3年間にわたる賃貸取引の詳細を含み、物件の特徴量(賃料、広さ、階数、その他)及びweb広告初掲載の日時と掲載終了日時が記録される。 本報告では、掲載開始日から終了日までを生存時間と考え、Cox回帰モデルを基本にニューラルネットで非線形に拡張した時空間モデルを提案する。 分析結果はまだ未完で、途中経過の報告となります。生存時間分析のレビューからはじめる予定です。
第2回
-
日時 : 2024年2月22日(木)15:30 ~ 16:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 西郷 甲矢人(長浜バイオ大学)
タイトル : 圏上の非可換確率空間:確率構造と因果構造の融合
概要 : 非可換確率空間は測度論的確率空間の一般化であり、量子論の数理的基盤でもある。 一方、因果構造の一般的取り扱いにおいて近年圏論的な枠組みが注目され始めている。 講演者は量子論(非可換確率構造)と相対論(因果構造)の融合である量子場の数理の 基盤として用いるためにこの概念を定義・研究してきたが、認知のモデル化や因果推論にもその応用が広がる可能性も見えてきた。基礎理論のみならず応用への可能性にも重点を置きながら、今後の展望を含めて議論したい。
第3回
-
日時 : 2024年3月21日(木)15:00 ~ 17:10
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者1 : 15:00~16:00 安齋 達彦(東京医科歯科大学 M&Dデータ科学センター)
タイトル : COVID-19流行下の自殺死亡数変動評価における統計モデルの活用
概要 : 新型コロナウイルス感染症(COVID-19)流行下には社会状況の大きな変化があり、日本では感染初期から自殺者の増加が懸念されていた。 一般に感染症流行による健康影響を評価するために、感染症が流行していない状況下で想定される死亡数の期待値と実際の観測値との差を表わす「超過死亡」が一つの指標として用いられることがあるが、 講演者らは日本国内での自殺による死亡に着目し、その超過死亡の動向から自殺死亡数の変動を評価し、さらにCOVID-19流行期間内における社会状況の変化と自殺死亡数の増減の関係性などについていくつか分析を行い発表してきた。 本発表では、これらの自殺死亡数の変動に関する疫学的検討を通して、その評価における統計モデルの活用について議論したい。 -
講演者2 : 16:10~17:10 高橋 邦彦(東京医科歯科大学 M&Dデータ科学センター)
タイトル : 疾病地図と空間疫学研究におけるデータ分析
概要 : あるデータに対してその位置情報を付加したデータは空間データとよばれ、近年その利活用が進んできている。 空間データを扱うことで、従来のデータによる「どのくらい」という量だけではなく、「どこに、どのくらい」という情報を得ることができ、 特に疾病発生をはじめとする健康関連分野における地域的な分布を分析する空間疫学では中心的なデータとなり、またそれを視覚化するための疾病地図も身近になってきている。 本講演では空間疫学における代表的な統計モデルや分析の概要とともに、感染症の発生や突発的な事象の発生を早期発見する際に利用されるクラスタ検出法として、講演者らが提案する疾病集積性の検定法とその応用について紹介する。
第4回
-
日時 : 2024年5月8日(水)16:00 ~ 17:00
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 内藤 貫太(東北大学大学院情報科学研究科)
タイトル : 多次元空間における埋め込み1次元曲線の同時信頼領域
概要 : 多次元空間に埋め込まれた1次元曲線の推測に関して考察を与える。 動機となるデータは、例えば生物種の多次元的な成長に着目した際に多く実在している。 このようなデータは多次元空間に埋め込まれた1次元曲線の周辺に存在するものとして理解すると都合が良い。 こういった多次元データから埋め込み1次元曲線の信頼領域を構築する方法については研究が少なく、特に“同時信頼領域”に関する研究は見当たらないようである。 本講演ではノンパラメトリック平滑化を用いて埋め込み1次元曲線の同時信頼領域を構築する方法について紹介する。 構築される信頼領域の理論的性質について議論を与える。 シミュレーション実験の結果および実データへの適用結果についても報告する。
第5回
-
日時 : 2024年5月22日(水)17:00 ~ 18:00
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 大石 峰暉(東北大学データ駆動科学・AI教育研究センター)
タイトル : ネットワークLassoの最適化について
概要 : リッジ回帰やLassoに代表される罰則付き推定法は広く普及しており、特にLassoのような絶対値に基づく手法はその解が陽な形で得られないため、最適化問題を解くためのアルゴリズムが重要となる。 代表的なものとして座標降下法や交互方向乗数法が挙げられる。特に近年では、その汎用性の高さから交互方向乗数法が注目されているが、これが必ずしも良いとは限らない。 本発表ではネットワークLassoの最適化問題に着目し、これら2つのアルゴリズムを比較した結果について報告する。
第6回
-
日時 : 2024年6月12日(水)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 山本 倫生(大阪大学)
タイトル : 関数データ解析に基づくスパース観測データのクラスタリング
概要 : 離散的にデータが観測される経時測定データや空間データに対して、関数データ解析では個々のデータを関数化し、得られた関数をデータとして扱って解析を行うことが多い。 例えば、個体ごとの観測点や観測点数が異なるデータの場合、古典的な解析手法では扱いづらいことが多いが、関数データ解析では関数化処理により容易に解析することができる。 経時測定データにおける個体のクラスタリングにおいても、個体ごとに事前に平滑化を施し関数化することで適切に解析可能である。 一方で、経時測定データにおいて、個体ごとに少数の時点でしか測定値が得られない場合がしばしば生じるが、そのようなスパース観測データにおいては、単純な関数化処理ではその背後にあるクラスタ構造を推定することは困難である。 本発表では、まずは単純な関数化処理に基づくクラスタリング法や関連手法について紹介し、スパース観測データに対するシンプルなクラスタリング法の提案について説明する。
第7回
-
日時 : 2024年6月19日(水)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 吉本 敦(統計数理研究所)
タイトル : Landscape Ecology & Resoruce Managementを軸にした最適化モデルの展開
概要 : 森林資源を取り巻く社会環境は過去数十年で大きく変化してきました。それに伴い、資源管理の意思決定を支援する最適化モデルも複雑化しています。 かつて木材生産を主目的として利用されてきた森林資源は、現在では野生動物の生息地などの森林生態系サービスを提供する資源として見直され、その管理の仕方も様々な時空間的な制約が課されるようになっています。 1980年代に導入された大面積皆伐を回避する隣接制約に続き、伐採後の緑化回復を狙った隣接緑化制約、隣接制約により細分化され過ぎた林分を逆に集約する最大伐採許容面積制約などが新たに考慮されるようになってきました。 最近では、小規模な保護区を拡張するためのバッファーゾーン形成や、分断された生息地をコリドーで連結するコリドー形成問題なども資源管理で考慮するようになり、Landscape EcologyとResource Managementを対象とした 最適化モデルが展開されています。これらの制約はしばしば連続的な伐採作業を分断し、環境保護活動と連動していますが、解の探求は非常に困難になっています。今回の発表では、これまでに構築してきた最適化モデルを紹介します。
第8回
-
日時 : 2024年6月27日(木)16:30 ~ 18:00
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 黒木 学(横浜国立大学)
タイトル : “Probabilities of Causation”とその周辺の話題
概要 : 原因の究明は、統計的因果推論が取り組む問題階層のなかで最上位にランクされる、解決することが最も困難とされている問題である。 本発表では、原因の究明を行う際の重要な概念である原因の確率を取り上げ、その基本的な考え方を概説するとともに、時間が許す限り、講演者がこれまで行ってきた研究成果について紹介する。
第9回
-
日時 : 2024年7月12日(金)16:30 ~ 17:45
場所 : 東北大学大学院情報科学研究科棟7階711セミナー室
講演者 : 服部 聡(大阪大学大学院 医学系研究科 医学統計学教室)
タイトル : 推定方程式制約下での線形計画法による未観測交絡に対する感度解析法
概要 : 無作為化試験はもっとも強固な医学的根拠を創出する試験デザインとして広く受け入れられているが、無作為化試験の実施には多大な費用と時間が掛かり、疾患レジストリーや電子カルテデータなどの既存データを有効活用する試みが、リアルワールドデータの名のもとに広く関心を集めている。 統計解析は観察研究の方法に則ることになり、交絡因子を適切に調整する必要がある。そのために傾向スコアによる解析が広く用いられている。傾向スコアによる解析を行う際に、傾向スコアで調整できない未観測交絡の問題が常に研究の限界として残される。 未観測交絡の潜在的な影響を評価する感度解析の方法が様々提案されているが、未観測な変数へのモデリングを含むため、何らかの検証不可能な仮定に依存せざるを得ず、解釈が容易でない。 本研究では、通常はパラメトリック傾向スコアの未知パラメータの推定に用いられる推定方程式を、傾向スコアが満たすべき制約ととらえ、推定方程式を制約とする線形計画法により未観測交絡の影響を評価する方法を提案する。 提案法は解釈困難な感度解析パラメータの設定を最小限にした上で、平均因果効果の上限と下限を与える。その範囲が十分に狭くない場合には、既存の方法のような制約を課して範囲を狭めることも可能であるが、既存法よりも狭い範囲を与えることが経験的に確認された。 また、このアイディアはメタアナリシスにおける公表バイアスの評価にも有用で、これまで困難であった公表バイアスのノンパラメトリックな上限評価のための簡明な方法を与えることができる。
第10回
-
日時 : 2024年7月31日(水)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟711演習室
講演者 : 根元 多佳子(東北大学情報科学研究科)
タイトル : 統計的仮説検定と論理
概要 : 背理法とは、「『Aでない』を仮定すると矛盾が導出されるならば、Aである」という論法である。背理法を用いて導出される命題には例えば、「上に有界な実数の集合には上限がある」などがある。一方、統計的仮説検定では、帰無仮説の棄却は次の推論に基づいて行われる。
1. 検定統計量が棄却域に属する
2. 高確率で対立仮説が成立する
3. 高確率で帰無仮説は成立しない
このことから、仮説検定を「危険率付きの背理法である」と説明する入門書もあるが、論理学の観点からみてこれは妥当だろうか?また、よりよく仮説検定を説明できる論理は構成できるだろうか?本講演ではこれらの点について検討する。尚、本講演内容は大森仁准教授との議論によるものである。
第11回
-
日時 : 2024年8月30日(金)16:00 ~ 17:00
場所 : 東北大学大学院情報科学研究科棟2階中講義室
講演者 : 藤原 直哉(東北大学情報科学研究科)
タイトル : 人流データと、都市における個人間接触の分析
概要 : 近年、携帯電話から高精度かつ大量の位置情報データを取得することが可能となっている。 人の空間的移動の分析については、多くの分野で研究の蓄積があるが、大規模なデータの出現により、これまで知られていなかった人流に関する新たな法則性が明らかになっている。 人流データを用いた分析対象は、個人単位での移動に加え、近年では個人間の接触にも広がりを見せている。 本講演では、人流データ分析に関連する研究を紹介し、特に、個人間の接触分析の可能性に関する最近の結果を報告する。
第12回
-
日時 : 2024年10月7日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 李昕翮(東北大学情報科学研究科・河村研究室)
タイトル : BERTopic モデルを利用した震災復興研究:宮城県議会議員は何を発言してきたのか
概要 : 本研究は、BERTopicモデルを用いて、2011年から2020年までの宮城県議会議員の一般質問を分析した。 結果として、復興期間中「災害復興」に焦点を当てた議論が展開され、各トピックが相互に関連し合い、中心的なトピックとしてネットワークを形成していたことが明らかになった。 また、災害の影響に基づく地域ごとのトピックの多様性が見られたが、選挙公約では「災害復興」に関する話題は減少していたものの、宮城県議会で10年以上にわたり持続的に議論されていたことが確認された。 さらに、本研究は大規模なデータセットに依存していることによる限界を認め、議員の発言背後にある社会政治的なニュアンスを理解するためには質的なアプローチが必要であることを指摘している。
第13回
-
日時 : 2024年10月11日(金)16:00 ~ 17:00
場所 : Zoomによるオンライン開催
講演者 : Prof. Il Do Ha(Pukyong National University, Korea)
タイトル : Joint AFT random-effect modeling approach for clustered competing-risks data
概要 : Competing risks data arise when occurrence of an event hinders observation of other types of events, and they are encountered in various research areas including biomedical research. These data have been usually analyzed using the hazard-based models, not survival times themselves. In this talk, we propose a joint accelerated failure time (AFT) modeling approach to model clustered competing risks data. Times to competing events are assumed to be log-linear with normal errors and correlated through a scaled random effect that follows a zero-mean normal distribution. Inference on the model parameters is based on the h-likelihood. Performance of the proposed method is evaluated through extensive simulation studies. The simulation results show that the estimated regression parameters are robust against the violation of the assumed parametric distributions. The proposed method is illustrated with two real competing risks data sets. In addition, we present further extensions.
Keywords: Joint AFT model; competing risks; h-likelihood; clustered survival data
第14回
-
日時 : 2024年10月21日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 村上 大輔(統計数理研究所)
タイトル : Reluctant interaction modelingによる時空間可変パラメータモデルの高速化
概要 : 時空間可変パラメータモデルは、回帰係数の時空間パターンを明らかにするために幅広く用いられてきた。 解釈しやすい分析結果を得るためには、ありうる時空間パターンの中から重要なものだけを選択することが望ましいが、特に大規模データの場合その計算コストは大きくなる。 そこで本研究では、計算効率良く時空間可変パラメータモデルを推定・選択する方法を開発する。 同手法では、各基底関数の内積を用いて一連のモデリングを行うとともに、reluctant interaction modelingを応用して高次元になりがちな交互効果を効率よく扱うことで、計算コストの軽減を行う。 モンテカルロ実験により、提案手法の精度が既存手法を上回ることを確認した。また、提案手法を犯罪データの分析に適用し、その実用上の有用性を確認した。
第15回
-
日時 : 2024年10月28日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階大講義室
講演者 : 大林 武(東北大学情報科学研究科)
タイトル : 日本沿岸のプランクトン動態解明に向けたゲノム解析基盤の整備
概要 : 海洋熱波や海洋酸性化は、漁業をはじめとする地域経済や地域文化に甚大な影響を及ぼしつつあります。 温暖化などの環境変化は徐々に進行しますが、それに対する生態系の応答は非線形であるため、生態系の変化を予測することは容易ではありません。 さらに、生態系は大気中の二酸化炭素収支などを通じて、気候や海洋環境にも影響を及ぼします。すなわち、生態系と物理系は相互に依存する一体化したシステムであり、それが将来予測を一層難しくしています。 本年設立された変動海洋エコシステム高等研究所(WPI-AIMEC)は、海洋物理学と海洋生態学を統合し、変動する海洋エコシステムの理解を目指しています。 私たち沿岸生態系サービス研究ユニットは、女川湾をはじめとする複数の湾で毎月サンプリングを行い、環境データと共にプランクトンの存在状態や機能を網羅的に解析するための基盤データベースの構築を進めています。 本セミナーでは、データベースの構築状況を紹介し、どのようなデータ解析手法が海洋生態系の理解に貢献するかを議論します。
第16回
-
日時 : 2024年11月11日(月)16:30 ~ 17:30
場所 : 東北大学大学院情報科学研究科棟2階中講義室
講演者 : 河村 和徳(東北大学情報科学研究科)
タイトル : 世論調査・住民意識調査が抱える課題
概要 : 社会科学分野で用いられている世論調査や住民意識調査は、「選挙の当選者を予測したい」「行政需要を可視化したい」という社会的な要求から市民権を獲得してきました。 かつては世論調査や住民意識調査の実施・分析は職人芸的な印象がありましたが、1990年代以降、PCの演算処理能力が向上したこと、社会科学系でも統計学を教える体制が整ってきたことなどの影響で、広く行われるようになっています。 また、DBPM(Data Based Policy Making)といった意識変化もあり、政策形成の分野でも利用されるようになっています。 ただ、これらの調査を行うにあたっては実施費用や回収率など様々な課題があり、トラブルが生じた場合もあります。また研究者の間でも若手研究者がなかなか手を出せないという課題もあります。 これら現状と課題について、具体的な事例を交えながら解説したいと思います。
・感想やコメントなど
第17回
Simon Wood教授 講演会
「Generalized Additive Modelling methods for two issues in health/epidemiology」
- Simon Wood 教授(School of Mathematics, University of Edinburgh)
- 東北大学情報科学研究科数学教室【情報数理談話会】2023年3月6日
於:東北大学大学院情報科学研究科 - 要旨: Air pollution and Covid-19 offer two recent public health issues with significant worldwide impact. Statistical regression models constructed in terms of smooth functions of predictor variables - generalized additive models - can be very helpful in analyzing data arising in relation to both. This talk illustrates this with two case studies. The first is the modelling of 40 years worth of spatially references daily particulate air pollution data over the UK, with the aim of producing epidemiologically useful pollution burden estimates at different locations and times: the data contain some 10 million observations, and novel methods were required to deal with this data volume. The second case study concerns inference of the daily number of new Covid-19 infections from the clinical data available. GAM like models are useful, but some method extensions are needed to obtain the best possible reconstructions. Interestingly, in the UK context infections appear to have been in decline some time before each of the full stay-at-home lockdowns, with the timing of lockdown coinciding rather with an immediate rapid increase in deaths, which lag infections by several weeks.