求知 文章 文库 Lib 视频 iPerson 课程 角色 咨询 工具 讲座 Model Center   Code  
讲座:视觉大模型技术与应用

主讲:刘老师
哈佛大学人工智能方向博士后/高级访问学者
时间:2026年1月24日
费用:免费
分享重点:
      视觉大模型可以解决传统机器视觉方案的标注成本高、泛化能力弱、场景迁移难的痛点。本讲座介绍视觉大模型的解决方案和行业实践经验。
  • 课程安排:

    • 1. 行业为什么需要视觉大模型
    • 传统视觉方案的痛点
    • 大模型带来的改变
    • 2. 视觉大模型的通用能力底座
    • 通用检测、分割、识别
    • 零样本 / 小样本
    • 语言驱动视觉理解
    • 3. 图像分割大模型的行业实践
    • 工业与制造
      • SAM:工件、缺陷区域分割
      • Grounded-SAM:语言描述定位
    • 异常安防与城市治理
      • SAM2:视频目标连续分割
      • Semantic-SAM:城市要素语义分割
    • 机器人与智能系统
      • Sa2VA:视觉能力进入 Agent
      • 从“看见”到“行动”
    • 4. 行业落地模式总结
    • 大模型 ≠ 直接替代业务系统
    • “大模型 + 行业规则 + 小模型”的组合路线
    • 5. 未来展望
    • 视觉大模型的产业化趋势
    • 从单点算法到智能平台
  • 目标听众:关注AI的技术人员
  • 请关注官方微信号,了解后续的课程!
     
    问题收集(以下为最新20个问题)
    暂无数据
    阅读 3 1