现在,几米课堂联合智魔AI实验室核心研发团队,推出智魔LLM多模态视觉大模型课程!从底层原理到工程落地,从模型调优到行业应用,手把手教你掌握"文本+图像"多模态交互的核心技术,让你从"单模态开发者"升级为"多模态应用架构师"!

*   1.大模型技术概述/

  *   1. 视觉大模型技术概述.mp4 (21.88 MB)

*   2.自监督学习的原理与方法/

  *   2.1自监督学习与前置任务.mp4 (17.74 MB)

  *   2.2对比学习与SimCLR.mp4 (18.62 MB)

  *   2.3Moco模型.mp4 (11.71 MB)

  *   2.4MoCo代码详解.mp4 (23.52 MB)

  *   2.5掩码重建与BEiT.mp4 (10.54 MB)

*   3.视觉基础大模型的架构/

  *   3.1 ViT与其变种.mp4 (15.14 MB)

  *   3.2 MoCo v3自监督骨干网络.mp4 (7.81 MB)

  *   3.3 DINO模型.mp4 (12.63 MB)

  *   3.4 DINO代码详解.mp4 (17.19 MB)

  *   3.5 MAE模型.mp4 (9.64 MB)

  *   3.6 MAE代码详解.mp4 (26.33 MB)

  *   3.7 SAM模型.mp4 (23.55 MB)

*   4.多模态视觉大模型/

  *   4.1 多模态学习的概念.mp4 (28.11 MB)

  *   4.2 多模态网络的架构.mp4 (23.62 MB)

  *   4.3 CLIP模型.mp4 (19.34 MB)

  *   4.4 CLIP代码详解.mp4 (28.17 MB)

  *   4.5 GLIP模型.mp4 (11.26 MB)

  *   4.6 Flamingo模型.mp4 (27.58 MB)

  *   4.7 LLaVA模型.mp4 (44.59 MB)

*   5.下游任务迁移与视觉提示/

  *   5.1 线性探测与微调.mp4 (8.80 MB)

  *   5.2 线性探测与微调代码详解.mp4 (12.66 MB)

  *   5.3 Adapter方法.mp4 (13.31 MB)

  *   5.4 Adapter代码详解.mp4 (55.46 MB)

  *   5.5 视觉prompt方法.mp4 (58.06 MB)

  *   5.6 视觉Prompt代码详解.mp4 (36.99 MB)

  *   5.7 小结.mp4 (3.56 MB)

*   6.实战-多模态大模型微调/

  *   6.1 PandaGPT框架介绍.mp4 (44.93 MB)

  *   6.2 环境与模型配置.mp4 (108.10 MB)

  *   6.3 项目代码通览.mp4 (109.86 MB)

  *   6.4 数据集加载.mp4 (94.70 MB)

  *   6.5 模型定义.mp4 (144.59 MB)

  *   6.6 模型实现.mp4 (234.10 MB)

  *   6.7 Demo运行.mp4 (62.57 MB)

  *   Vicuna模型加载指南.txt (0.00 MB)

  *   code .zip (27.63 MB)

  *   端口映射方法.txt (0.00 MB)

*   7.实战-基于视觉提示的下游迁移/

  *   7.1 VPT框架通览.mp4 (127.32 MB)

  *   7.2 数据集加载.mp4 (109.92 MB)

  *   7.3 模型定义.mp4 (155.92 MB)

  *   7.4 模型实现1.mp4 (94.20 MB)

  *   7.5 模型实现2.mp4 (76.86 MB)

  *   7.6 病理图像下游迁移.mp4 (43.75 MB)

  *   BCI数据集下载.txt (0.00 MB)

  *   code .zip (1.00 MB)

*   PPT/

  *   0.视觉大模型课程前置介绍.pptx (1.90 MB)

  *   1.大模型技术概述.pptx (5.31 MB)

  *   2.自监督学习的原理与方法.pptx (3.04 MB)

  *   3.视觉基础大模型的架构.pptx (3.02 MB)

  *   4.多模态视觉大模型.pptx (4.79 MB)

  *   5.下游任务迁移与视觉提示.pptx (1.59 MB)

*   PPT.zip (19.13 MB)

*   code/

  *   CLIP.py (0.00 MB)

  *   DINO.py (0.00 MB)

  *   MAE.py (0.00 MB)

  *   adapter.py (0.00 MB)

  *   linear-probing.py (0.00 MB)

  *   moco.py (0.00 MB)

  *   prompt-tuning.py (0.00 MB)

  *   全部代码压缩包.zip (0.01 MB)

*   论文/

  *   Gemini-A Family of Highly Capable Multimodal Models.pdf (25.69 MB)

  *   ImageBind-One Embedding Space To Bind Them All.pdf (6.34 MB)

  *   InternVL-Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks.pdf (1.25 MB)