鈴木雅弘

Masahiro Suzuki

日興アセットマネジメント株式会社
クオンツアナリスト

東京大学大学院工学系研究科
システム創成学専攻
和泉研究室 (博士課程)

Mail : msuzuki [at] g.ecc.u-tokyo.ac.jp

: 0000-0001-8519-5617

: scholar.google.com/citations?user=_-8tzX0AAAAJ

: researchmap.jp/masahiro-suzuki

: Masahiro-Suzuki-11

: github.com/retarfi

: linkedin.com/in/msuzuki7/

News

日本データベース学会 Newsletter 2025年6月号にThe Web Conference 2025 参加報告を寄稿しました．
"Economy Watchers Survey provides Datasets and Tasks for Japanese Financial Domain"がThe Web Conference 2025に採択されました．

自己紹介

研究分野：テキストマイニング，自然言語処理（金融分野がメイン，一部農業・医療）

所属学会：IEEE・言語処理学会・人工知能学会

スキル：Python，サーバー管理（研究室にて10台以上のGPU含むサーバーのセットアップとメンテナンス経験あり）

その他：2025年9月に博士課程卒業予定です．企業でリサーチ業務をしていますが，兼務でアカデミアでも研究を続ける機会を探しております．

略歴

2022/10 - : 東京大学工学系研究科システム創成学専攻和泉研究室 (博士後期課程)

2022/04 - : 日興アセットマネジメント株式会社

2020/04 - 2022/03: 東京大学工学系研究科システム創成学専攻和泉研究室 (修士課程)

2019/05 - 2020/03 : 東京大学工学部システム創成学科和泉研究室

2018/04 - 2020/03 : 東京大学工学部システム創成学科システムデザイン&マネジメント(SDM)コース

2016/04 - 2020/03 : 東京大学運動会ゴルフ部

2016/04 - 2018/03 : 東京大学教養学部前期課程理科二類

2015/04 - 2016/03 : 慶應義塾大学理工学部管理工学科

2009/04 - 2015/03 : 筑波大学附属駒場中・高等学校

1996/09 : 東京生まれ

公開リソース

景気ウォッチャー調査のデータセット (Hugging Face Datasets)
日本語DeBERTaV2モデル (base / small)
日本語大規模言語モデルプロジェクト
日本語のデータセットやチューニングモデルが記載されたページを公開中。
プロジェクト詳細
BERT・ELECTRAの日本語事前学習プログラム (github.com/retarfi/language-pretraining)
日本語Wikipediaや金融ドメインをコーパスに用いて訓練した、BERTやELECTRAの事前学習モデル。それぞれWikipediaモデルと金融モデルが自然言語処理ライブラリのTransformersにて利用可能 (huggingface.co/izumi-lab)。
jptranstokenizer: Japanese Tokenzier for transformers (github.com/retarfi/jptranstokenizer)
HuggingFaceのtransformersライブラリと互換性のあるトークナイザーライブラリ。MeCabやJuman++、sudachi、spaCy LUWがmain-wordのトークナイザーとして、またWordpieceとsentencepieceがsubwordのトークナイザーとして利用可能。Juman++とsentencepieceのような組み合わせで学習されたトークナイザーを容易に読み込める。
PyPI

論文

審査付学術雑誌論文

Impact of Information Disparity between Individual Investors on Profits of Meme Stocks Using an Artificial Market Simulation Approach
Miyuki Matsumoto, Ryuji Hashimoto, Masahiro Suzuki, Yuri Murayama, and Kiyoshi Izumi.
Journal of Computational Social Science, 2025.
SpringerLink bib
Sentiment works in small-cap stocks: Japanese stock’s sentiment with language models
Masahiro Suzuki, Yasushi Ishikawa, Masayuki Teraguchi, and Hiroki Sakaji.
International Journal of Information Management Data Insights, 2025.
Elsevier bib
FinDeBERTaV2: 単語分割フリーな金融事前学習言語モデル
鈴木雅弘, 坂地泰紀, 平野正徳, and 和泉潔.
人工知能学会論文誌, 2024.
J-STAGE bib
Development and analysis of medical instruction-tuning for Japanese large language models
Issey Sukeda, Masahiro Suzuki, Hiroki Sakaji, and Satoshi Kodera.
AIH, 2024.
AccScience bib
Constructing and analyzing domain-specific language model for financial text mining
Masahiro Suzuki, Hiroki Sakaji, Masanori Hirano, and Kiyoshi Izumi.
Information Processing & Management, 2023.
Impact Factor: 8.6, Q1 Journal as of 2022
Elsevier paper detail
Forecasting Stock Price Trends by Analyzing Economic Reports With Analyst Profiles
Masahiro Suzuki, Hiroki Sakaji, Kiyoshi Izumi, and Yasushi Ishikawa.
Frontiers in Artificial Intelligence, 2022.
Impact Factor (2022): 4.0
Frontiers bib
Forecasting Net Income Estimate and Stock Price Using Text Mining from Economic Reports
Masahiro Suzuki, Hiroki Sakaji, Kiyoshi Izumi, Hiroyasu Matsushima, and Yasushi Ishikawa.
Information, 2020.
Selected as Cover Story
MDPI bib

審査付国際会議

Economy Watchers Survey Provides Datasets and Tasks for Japanese Financial Domain
Masahiro Suzuki, and Hiroki Sakaji.
The ACM Web Conference 2025, 2025.
ACM arXiv bib
FinPersona: An LLM-Driven Conversational Agent for Personalized Financial Advising
Takehiro Takayanagi, Masahiro Suzuki, Kiyoshi Izumi, Javier Sanz-Cruzado, Richard McCreadie, and Iadh Ounis.
Advances in Information Retrieval, 2025.
ECIR 2025
Springer Nature bib
Refined and Segmented Price Sentiment Indices from Survey Comments
Masahiro Suzuki, and Hiroki Sakaji.
2024 IEEE International Conference on Big Data (Big Data), 2024.
IEEE arXiv bib
Is ChatGPT the Future of Causal Text Mining? A Comprehensive Evaluation and Analysis
Takehiro Takayanagi, Masahiro Suzuki, Ryotaro Kobayashi, Hiroki Sakaji, and Kiyoshi Izumi.
2024 IEEE International Conference on Big Data (Big Data), 2024.
IEEE arXiv bib
Sentiment-driven Stock Selection in Japan using Language Models
Masahiro Suzuki, and Hiroki Sakaji.
2024 IEEE Symposium on Computational Intelligence for Financial Engineering and Economics (CIFEr), 2024.
JaFIn: Japanese Financial Instruction Dataset
Kota Tanabe, Masahiro Suzuki, Hiroki Sakaji, and Itsuki Noda.
2024 IEEE Symposium on Computational Intelligence for Financial Engineering and Economics (CIFEr), 2024.
IEEE arXiv bib
JMedLoRA:Medical Domain Adaptation on Japanese Large Language Models using Instruction-tuning
Issey Sukeda, Masahiro Suzuki, Hiroki Sakaji, and Satoshi Kodera.
Deep Generative Models for Health Workshop NeurIPS 2023, 2023.
OpenReview arXiv bib
From Base to Conversational: Japanese Instruction Dataset and Tuning Large Language Models
Masahiro Suzuki, Masanori Hirano, and Hiroki Sakaji.
2023 IEEE International Conference on Big Data (Big Data), 2023.
IEEE arXiv SSRN bib
llm-japanese-dataset v0: Construction of Japanese Chat Dataset for Large Language Models and its Methodology
Masanori Hirano, Masahiro Suzuki, and Hiroki Sakaji.
The 12th International Workshop on Web Services and Social Media (WSSM-2023) in The 26th International Conference on Network-Based Information Systems (NBiS-2023), 2023.
Springer Link arXiv SSRN bib
Gradual Further Pre-training Architecture for Economics/Finance Domain Adaptation of Language Model
Hiroki Sakaji, Masahiro Suzuki, Kiyoshi Izumi, and Hiroyuki Mitsugi.
2022 IEEE International Conference on Big Data (Big Data), 2022.
IEEE paper detail
Constructing and analyzing domain-specific language model for financial text mining
Masahiro Suzuki, Hiroki Sakaji, Masanori Hirano, and Kiyoshi Izumi.
Information Processing and Management Conference, 2022.
Market Trend Analysis Using Polarity Index Generated from Analyst Reports
Rei Taguchi, Hikaru Watanabe, Masanori Hirano, Masahiro Suzuki, Hiroki Sakaji, Kiyoshi Izumi, and Kenji Hiramatsu.
2021 IEEE International Conference on Big Data (Big Data), 2021.
IEEE bib
Stock Price Analysis Using Combination of Analyst Reports and Several Document
Masahiro Suzuki, Toshiya Katagi, Hiroki Sakaji, Kiyoshi Izumi, and Yasushi Ishikawa.
2019 International Conference on Data Mining Workshops (ICDMW), 2019.
Best Paper Award
IEEE paper detail

国内会議・その他

消費者と企業の区分情報を活用した物価センチメント指数のセグメント化
鈴木雅弘, and 坂地泰紀.
人工知能学会全国大会論文集, 2025.
J-STAGE bib
地方農業に特化したQAデータセットの構築と検証
板倉亮真, 鈴木雅弘, 坂地泰紀, 野田五十樹, 小林暁雄, 大友将宏, 石原潤一, and 桂樹哲雄.
人工知能学会全国大会論文集, 2025.
J-STAGE bib
農業新聞からの因果関係抽出の試みと分析
桂樹哲雄, 坂地泰紀, 小林暁雄, 森翔太郎, 大友将宏, 石原潤一, 鈴木雅弘, 川村隆浩, and 野田五十樹.
人工知能学会全国大会論文集, 2025.
J-STAGE bib
故障解析における事前学習済みSentence-DeBERTaによる拡張ナレッジグラフとクエリ分解を用いたGraphRAG
小島湧太, 坂地泰紀, 鈴木雅弘, 中村格士, 坂田大晃, 関和也, 勅使河原優, 山下雅己, and 青山和浩.
言語処理学会第31回年次大会, 2025.
paper detail
事前学習言語モデルのドメイン適応能力に関する分析：ドメイン特有ニューロンの検出と分析
鈴木雅弘, 高柳剛弘, 坂地泰紀, and 和泉潔.
言語処理学会第31回年次大会, 2025.
paper detail
景気ウォッチャー調査のデータセット構築と物価センチメント分析
鈴木雅弘, and 坂地泰紀.
人工知能学会第34回金融情報学研究会 (SIG-FIN), 2025.
JSTAGE bib
社会的価値観の融和を誘導する対話システムの開発
小林涼太郎, 高柳剛弘, 鈴木雅弘, 小倉有紀子, and 坂地泰紀.
NLP若手の会第19回シンポジウム (YANS), 2024.
景気ウォッチャー調査を用いた金融・経済ドメインのデータセットとタスク
鈴木雅弘, and 坂地泰紀.
信学技報, 2024.
IEICE Jxiv bib
JaFIn：日本語金融インストラクションデータセット
田邉耕太, 鈴木雅弘, 坂地泰紀, and 野田五十樹.
信学技報, 2024.
IEICE paper detail
金融分野における大規模言語モデルの活用
和泉潔, 村山友理, 鈴木雅弘, 高柳剛弘, 中筋渉太, 小林涼太郎, and 山本蒔志.
人工知能学会全国大会, 2024.
confit bib
会社四季報のセンチメントを用いた株式銘柄選定の試み
鈴木雅弘.
人工知能学会全国大会論文集, 2024.
J-STAGE bib
人工市場による社会ネットワーク上の情報伝播が株価に与える影響の分析
松本美由紀, 橋本龍二, 鈴木雅弘, 村山友理, and 和泉潔.
人工知能学会全国大会論文集, 2024.
J-STAGE bib
普及指導員の知識を回答可能な生成 AI のための農産物市場価値を表現するデータセットの構築
小林暁雄, 坂地泰紀, 桂樹哲雄, 森翔太郎, 橋本祥, 鈴木雅弘, and 川村隆浩.
人工知能学会全国大会論文集, 2024.
J-STAGE bib
JMedLoRA：Instruction-tuningによる日本語大規模モデルの医療ドメイン適用
助田一晟, 鈴木雅弘, 坂地泰紀, and 小寺聡.
言語処理学会第30回年次大会, 2024.
paper detail
複数ノードを用いた言語モデルの構築とドメイン適応
鈴木雅弘, and 坂地泰紀.
研究報告知能システム (ICS), 2024.
IPSJ paper detail
日本語インストラクションデータを用いた対話可能な日本語大規模言語モデルのLoRAチューニング
鈴木雅弘, 平野正徳, and 坂地泰紀.
信学技報, 2023.
IEICE Jxiv bib
llm-japanese-dataset v0: 大規模言語モデルのための日本語チャットデータセット構築
平野正徳, 鈴木雅弘, and 坂地泰紀.
情報処理学会第257回自然言語処理研究発表会, 2023.
若手奨励賞(共著)
SIG-NL Jxiv bib
日本語インストラクションデータセットの構築とその適用による大規模言語モデルのチューニング
鈴木雅弘, 平野正徳, and 坂地泰紀.
NLP若手の会第18回シンポジウム (YANS), 2023.
奨励賞・ELYZA賞(スポンサー賞)
Causal Text Mining in the Era of Large Language Modeling: A Reality Check
高柳剛弘, 小林涼太郎, 鈴木雅弘, 坂地泰紀, and 和泉潔.
NLP若手の会第18回シンポジウム (YANS), 2023.
時系列に並んだ金融文書からの差分抽出タスクの提案
鈴木雅弘, 坂地泰紀, and 和泉潔.
人工知能学会全国大会論文集, 2023.
J-STAGE bib
異なる単語分割システムによる日本語事前学習言語モデルの性能評価
鈴木雅弘, 坂地泰紀, and 和泉潔.
言語処理学会第29回年次大会 (NLP2023), 2023.
paper detail
時系列に並んだ複数のアナリストレポートを用いた株価動向予測
鈴木雅弘, 坂地泰紀, 和泉潔, and 石川康.
社会システムと情報技術研究ウィーク(WSSIT2022) 人工知能学会「社会における AI」研究会第43回研究会, 2022.
paper detail
事前学習と追加事前学習による金融言語モデルの構築と検証
鈴木雅弘, 坂地泰紀, 平野正徳, and 和泉潔.
人工知能学会第28回金融情報学研究会 (SIG-FIN), 2022.
paper detail
金融文書を用いた追加事前学習言語モデルの構築と検証
鈴木雅弘, 坂地泰紀, 和泉潔, and 石川康.
言語処理学会第28回年次大会 (NLP2022), 2022.
paper detail
アナリストレポートから生成した極性指標を用いた市場動向分析
田口怜, 渡邊光, 平野正徳, 鈴木雅弘, 坂地泰紀, 和泉潔, and 平松賢士.
人工知能学会第27回金融情報学研究会 (SIG-FIN), 2021.
J-STAGE SIG-FIN paper detail
金融文書を用いた事前学習言語モデルの構築と検証
鈴木雅弘, 坂地泰紀, 平野正徳, and 和泉潔.
人工知能学会第27回金融情報学研究会 (SIG-FIN), 2021.
J-STAGE SIG-FIN paper detail
金融ドメインにおける事前学習BERTモデルの性能検証
鈴木雅弘, 坂地泰紀, 平野正徳, and 和泉潔.
信学技報, 2021.
IEICE paper detail
金融ドメインの事前学習BERTモデルの構築に向けて
鈴木雅弘, 坂地泰紀, 平野正徳, and 和泉潔.
NLP若手の会第16回シンポジウム (YANS), 2021.
テキストマイニングによるアナリストレポートを用いた株価動向予測
鈴木雅弘, 堅木聖也, 坂地泰紀, 和泉潔, and 石川康.
言語処理学会第26回年次大会 (NLP2020), 2020.
paper detail
テキストマイニングを用いたアナリストレポートからの純利益予測
鈴木雅弘, 坂地泰紀, 和泉潔, 松島裕康, and 石川康.
人工知能学会全国大会論文集第34回 (2020), 2020.
JSTAGE bib

プレプリント

Interactive DualChecker for Mitigating Hallucinations in Distilling Large Language Models
Meiyun Wang, Masahiro Suzuki, Hiroki Sakaji, and Kiyoshi Izumi.
arXiv bib

奨学金・受賞

奨学金

2020/04 : トヨタ・ドワンゴ高度人工知能人材奨学金 (1年: 120万円)
2020/04 : JEES・ソフトバンクAI人材育成奨学金 (1年: 100万円)

受賞

2024/02 : 優秀研究賞, 電子情報通信学会言語理解とコミュニケーション研究会 (NLC)
NLC 研究賞2023年被表彰者
2024/02 : Most Innovative Application of Artificial Intelligence in Japan, Asia Asset Management 2024 Best of the Best Awards
日興アセットマネジメント株式会社
プレスリリース Asia Asset Management Best of the Best Awards
2023/09 : 若手奨励賞(共著), 情報処理学会自然言語処理(NL)研究会
情報処理学会NL研若手奨励賞
2023/09 : 若手奨励賞(共著), 情報処理学会自然言語処理(NL)研究会
情報処理学会NL研若手奨励賞
2023/08 : 奨励賞, NLP若手の会(Yans) 第18回シンポジウム
YANS Award
2023/08 : ELYZA賞(スポンサー賞), NLP若手の会(Yans) 第18回シンポジウム
YANS Award
2019/11 : Best Paper Award in the 2nd International Workshop on Cross-disciplinary Data Exchange and Collaboration (CDEC)
CDEC HP / 東京大学工学部紹介記事 / 東京大学大学院工学系研究科システム創成学専攻紹介記事

学会活動

2024/04-: 言語処理学会, YANSシンポジウム運営委員

その他

寄稿：日本データベース学会 Newsletter 2025年6月号 (Vol.18, No. 3)
The Web Conference 2025 参加報告
2019年度関東学生ゴルフ連盟男子 6月月例会: 48-45=93(72T)
東京大学運動会ゴルフ部ホームページ 2018年度制作