Publications

Huanyu Zhang*, Wenshan Wu*, Chengzu Li, Ning Shang, Yan Xia, Yangyu Huang, Yifan Zhang, Li Dong, Zhang Zhang, Liang Wang, Tieniu Tan, Furu Wei (2025). Latent Sketchpad: Sketching Visual Thoughts to Elicit Multimodal Reasoning in MLLMs. arXiv preprint arXiv:2510.24514.

Huanyu Zhang*, Chengzu Li*, Wenshan Wu, Shaoguang Mao, Yifan Zhang, Haochen Tian, Ivan Vulić, Zhang Zhang, Liang Wang, Tieniu Tan, Furu Wei (2025). Scaling and Beyond: Advancing Spatial Reasoning in MLLMs Requires New Recipes. *arXiv preprint arXiv:2504.15037 *.

Yi-Fan Zhang, Huanyu Zhang, Haochen Tian, Chaoyou Fu, Shuangqing Zhang, Junfei Wu, Feng Li, Kun Wang, Qingsong Wen, Zhang Zhang, Others (2025). MME-RealWorld: Could Your Multimodal LLM Challenge High-Resolution Real-World Scenarios that are Difficult for Humans?. The Thirteenth International Conference on Learning Representations.

PDF Cite Code Dataset Project

Chengzu Li, Wenshan Wu, Huanyu Zhang, Yan Xia, Shaoguang Mao, Li Dong, Ivan Vulić, Furu Wei (2025). Imagine while Reasoning in Space: Multimodal Visualization-of-Thought. arXiv preprint arXiv:2501.07542.

Huanyu Zhang, Chang Xu, Yi-Fan Zhang, Zhang Zhang, Liang Wang, Jiang Bian, Tieniu Tan (2024). TimeRAF: Retrieval-Augmented Foundation model for Zero-shot Time Series Forecasting (TKDE 2025). IEEE Transactions on Knowledge and Data Engineering.

Huanyu Zhang, Yi-Fan Zhang, Zhang Zhang, Qingsong Wen, Liang Wang (2024). LogoRA: Local-Global Representation Alignment for Robust Time Series Classification (TKDE 2024). IEEE Transactions on Knowledge and Data Engineering.