Yoshihiro Izawa

Affiliation

東京大学大学院情報理工学系研究科修士1年

山肩研究室

Mechanistic Interpretability

大規模言語モデル（LLM）の内部メカニズムを解明するMechanistic Interpretabilityを主な研究分野としています。Activation Steeringなど、モデルの解釈可能性と制御性の向上に取り組んでいます。

Yoshihiro Izawa, Gouki Minegishi, Koshi Eguchi, Sosuke Hosokawa, Kenjiro Taura

First AuthorICLR 2026 Workshop

Loading Publications...

工学部長賞（研究）—東京大学工学部2026研究

Loading Awards...

東京大学大学院情報理工学系研究科 / 山肩研究室2026.4 - 現在Current

東京大学工学部電子情報工学科 / 田浦研究室2022.4 - 2026.3

Loading Education...

Coming Soon...

Loading Presentations...