求知 文章 文库 Lib 视频 iPerson 课程 角色 咨询 工具 讲座 Model Center   Code  
讲座:视觉大模型技术与应用

主讲:刘老师
哈佛大学人工智能方向博士后/高级访问学者
时间:1月24日 周六 上午10:00-11:00
费用:免费
分享重点:
      视觉大模型可以解决传统机器视觉方案的标注成本高、泛化能力弱、场景迁移难的痛点。本讲座介绍视觉大模型的解决方案和行业实践经验。
  • 课程安排:

    • 1. 行业为什么需要视觉大模型
    • 传统视觉方案的痛点
    • 大模型带来的改变
    • 2. 视觉大模型的通用能力底座
    • 通用检测、分割、识别
    • 零样本 / 小样本
    • 语言驱动视觉理解
    • 3. 图像分割大模型的行业实践
    • 工业与制造
      • SAM:工件、缺陷区域分割
      • Grounded-SAM:语言描述定位异常
    • 安防与城市治理
      • SAM2:视频目标连续分割
      • Semantic-SAM:城市要素语义分割
    • 医疗与遥感
      • SAM:辅助分割、数据生成
      • 专用模型 + 大模型协同
    • 机器人与智能系统
      • Sa2VA:视觉能力进入 Agent
      • 从“看见”到“行动”
    • 4. 行业落地模式总结
    • 大模型 ≠ 直接替代业务系统
    • “大模型 + 行业规则 + 小模型”的组合路线
    • 5. 未来展望
    • 视觉大模型的产业化趋势
    • 从单点算法到智能平台
  • 目标听众:关注AI的技术人员
  • 请关注官方微信号,了解后续的课程!
     
    问题收集(以下为最新20个问题)
    1. 视觉大模型嵌入式应用能力及方案视觉大模型嵌入式应用进展
        视觉大模型训练需要的专业能力
        如何通过对大模型对任意类型文本精进行自动识别和标注
    2. 视觉大模型的推理效率是否成为规模化应用的主要障碍
    3. 视觉大模型如何应用于水下小目标智能识别
    4. 空中识别低空小型无人机技术能达到什么水平?或有什么技术路线。
        在低空飞行场景中,视觉大模型如何实现“看见”到“理解”?
    5. 视觉大模型嵌入式应用能力及方案
        视觉大模型嵌入式应用进展
    6. SAM和大模型如何融合
    7. 如何通过对大模型对任意类型文本精进行自动识别和标注
        推荐几个自动标注工具
        如果自动搜集网络上的垂域信息,包括书籍、论文、专利
    8. 视觉大模型训练需要的专业能力
    9. 向量数据库、视觉大模型的泛化能力、性能和硬件开销各有什么优劣?
        图片搜索向量数据库、视觉大模型哪个好?
        视觉大模型能不能切分并分布式部署?
    阅读 339 9