Research Icon

Yoshihiro Izawa

Affiliation

東京大学大学院 情報理工学系研究科 修士1年

山肩研究室

Research Field

Mechanistic Interpretability

About

大規模言語モデル(LLM)の内部メカニズムを解明するMechanistic Interpretabilityを主な研究分野としています。Activation Steeringなど、モデルの解釈可能性と制御性の向上に取り組んでいます。

Loading Publications...
Loading Awards...
Loading Education...
Loading Presentations...