整理文章的总体框架
修改Intrduction以及Related Work
阅读文献思考方法
初步思考:借鉴《Efficient Token-Guided Image-Text Retrieval With Consistent Multimodal Contrastive Training》文章中结合全局对齐与局部对齐
的方法,将整体的框架分为特征全局对齐与局部对齐两个阶段: