Zihao Liu

I am currently a Master’s student at the Communication University of China (CUC), supervised by Xiaoyu Wu. Actively seeking PhD opportunities in Multimodal LLMs, video/multi-modality understanding.

Github: https://github.com/Kamino666
Blog: https://blog.kamino.link/

Research Interests

Video Understanding, Video Anomaly Detection, Multi-modal Learning, Multi-modal Large Language Models.

Education

Communication University of China

2023 - Present

Signal and Information Processing, Master's Degree

Supervisor: Xiaoyu Wu
GPA: 3.8/4.0

Communication University of China

2019 - 2023

Digital Media Technology, Bachelor's Degree

GPA: 3.8/4.0

Publications

Rethinking Metrics and Benchmarks of Video Anomaly Detection

Zihao Liu, Xiaoyu Wu*, Wenna Li, Linlin Yang, Shengjin Wang.

ArXiv, under review, 2025

[ArXiv] [Code]

Language-guided Open-world Video Anomaly Detection under Weak Supervision

Zihao Liu, Xiaoyu Wu*, Jianqin Wu, Xuxu Wang, Linlin Yang.

ArXiv, under review, 2025

[ArXiv] [Code]

Enhancing Video Anomaly Understanding via Multi-Task Instruction Tuning

Xuxu Wang, Xiaoyu Wu*, Zihao Liu

IEEE Signal Processing Letters (SCI-Q2), 2025

[Link]

LoCo-MAD: Long-Range Context-Enhanced Model Towards Plot-Centric Movie Audio Description

Jiayi Wang, Zihao Liu, Xiaoyu Wu*.

ACCV'24 (CCF-C), 2024

[PDF] [Code]

Adaptively Building a Video-language Model for Video Captioning and Retrieval without Massive Video Pretraining

Zihao Liu, Xiaoyu Wu*, Shengjin Wang, Jiayao Qian.

ACM MM'24 (CCF-A), 2024

[PDF] [supp] [Code]

Violent Video Recognition Based on Global-local Visual and Audio Contrastive Learning

Zihao Liu, Xiaoyu Wu*, Shengjin Wang, Yimeng Shang.

IEEE Signal Processing Letters (SCI-Q2), 2024

[Link]

Semantic Multimodal Violence Detection Based on Local-to-global Embedding

Yujiang Pu, Xiaoyu Wu*, Shengjin Wang, Yuming Huang, Zihao Liu, Chaonan Gu

Neurocomputing (SCI-Q1), 2022

[PDF]

Multi-task Video Captioning with a Stepwise Multimodal Encoder

Zihao Liu, Xiaoyu Wu*, Ying Yu.

Electronics (SCI-Q2), 2022

[PDF] [Code]

Zihao Liu (刘子豪)

Research Interests

Education

Communication University of China

Communication University of China

Publications

Rethinking Metrics and Benchmarks of Video Anomaly Detection

Language-guided Open-world Video Anomaly Detection under Weak Supervision

Enhancing Video Anomaly Understanding via Multi-Task Instruction Tuning

LoCo-MAD: Long-Range Context-Enhanced Model Towards Plot-Centric Movie Audio Description

Adaptively Building a Video-language Model for Video Captioning and Retrieval without Massive Video Pretraining

Violent Video Recognition Based on Global-local Visual and Audio Contrastive Learning

Semantic Multimodal Violence Detection Based on Local-to-global Embedding

Multi-task Video Captioning with a Stepwise Multimodal Encoder