2020 年下半年,一个老同学联系老猿,他开办的公司主要负责计算机视觉应用类软件的开发,例如用于石油行业钻井平台的监控,识别违规操作,提醒作业人员遵章守纪,主要使用 OpenCV 和人工智能 YOLO3 进行开发。但是遇到了一些难以解决的问题,一是基于 AI 的目标检测,依靠训练数据产生的目标识别能力存在不可控的问题,可能绝大多数情况识别都没有问题,但一旦存在问题时很难去解决,无法说出所以然,二是目标识别在多目标出现交叉重叠时无法精准识别,如多个人用不同姿势前后交叉站立,后排人员被遮挡后有些场景无法识别出来每个人。他想基于 AI 的目标识别加上对象组件化来解决这个问题,利用 AI 识别各个组件,如人的脑袋、手、足、躯干等,然后再基于这些组件去识别一个人,而不是用 AI 直接识别一个人,这样应该更精确。
老猿对 AI 根本没有研究,连图像处理都没学过,感觉帮不上他多少忙,但他给我打开了计算机视觉这扇门,于是从 2020 年 8 月开启了计算机视觉的学习之路。
老猿大学毕业已经好多年,高数知识都忘光了,为此断断续续花了 4 个月时间将集合、线性代数、导数、微积分知识的基础知识全部重新学习了一遍,并且学习时自己被这些数学知识真正的吸引,比大学阶段的被动学习完全不可同日而语。所以如果大学刚毕业没多久,高数知识还在的同学,在学习计算机视觉和其他 AI 方向时就有很好的基础。