九遊會官網平台

新闻資訊

如何看待計算機視覺未來的走向

本文介紹了目前,計算機視覺面臨幾大問題:

  • 需要大算力,需要大數據用于訓練,因此導进入suncity官网本太高。

  • 應用場景單一,目前用于無人駕駛,安防監控等少數領域。

  • 對CV人來說,內卷嚴重,市場接近飽和。

在知乎上,许多大牛從技術的角度上談了關于計算機視覺未來的走向,受益匪淺。結合前幾日看到的另一個問題,爲什麽许多人現在不看好商湯科技,在這裏,我想從社會的角度來談一談我對計算機視覺未來走向的看法。


日新月異,用它來形容現在社會的變化真是再恰當不過,而推動這個變化的是科技的高速發展。


我对技术的看法是,技术须服务于人,须对社会有益,推动社会进步。卖力实现这件事的正是企业,企业须将技术落地应用,酿成産品,才气为社会服务,为人类服务。


因此,說起我爲什麽不看好商湯科技,是因爲我覺得它沒有完成這件事。

作为一个技术人员,我平常看的工具算是比力多,是技术方面,産品方面也比力关注。经常看到商汤旷世又发了什么论文,却险些没见过它们研发出了什么新産品。在我的印象里,它们就像是一个研究所的存在。

然而,世界上已經有了這麽多高校、實驗室、研究所在搞學術研究,還差一個商湯曠世嗎?

在我看來,這與格力聲稱要做格力手機如出一轍。市面上已經有了蘋果,小米,華爲,OV等這麽多做的很好的手機,還差一個格力手機嗎?


所以董明珠如果要做手機,Z合適的就是自己做操作系統,或者自己搞芯片,做點對社會對市場有益的事情。但格力明顯沒有這個计划,我對它當初說要做手機就一直是冷眼相看。四五年過去了,就目前來看,還真沒看錯它。


企业照旧应该做企业该做的事情,那就是将学术研究落地应用,酿成産品。


在《下一個倒下的會不會是華爲》中有這樣一段話:


“我们 要做商人。科学家可以什么都不管,一辈子只研究蜘蛛腿的一根毛。对科学家来说,这是可以的。但是对我们呢?我们只研究蜘蛛腿,谁给我们饭吃?因此,不能光研究蜘蛛腿,要研究客户需求……”

這番話講于2002年,其時,“獅子”朗訊科技快要倒下了,“巨獅”摩托羅拉也病恹恹的……

朗訊科技Z焦点的資源——貝爾實驗室,正是以研究“蜘蛛腿”“蝴蝶翅膀”“馬尾巴的功效”等這些基礎課題見長的,它既是朗訊科技的成長助推器,也是朗訊科技的肩负;摩托羅拉以巨資投入銥星系統研發,結果尖端技術成爲它走向衰敗的滑鐵盧……這兩家公司以及衆多的“巨獅”都患上了資本和技術的“富營養病”,所以到頭來都被優勢資源所拖累、所詛咒。

商湯曠世在這一點上像極了朗訊和摩托羅拉,忽視了技術的Z終目的是服務于人,服務于社會。


谈及我对盘算机视觉的看法,技术和産品的关系就像是硬件与软件的关系。当技术生长到 水平时,如果産品的生长速度跟不上,那么技术就毫无作用。当産品生长起来后,又受到技术水平的限制,産品要进一步提高,需要提升技术水平。


从目前的情况来看,学术研究(或者称技术)已经到达了 的水平,而落地应用的领域(或者说産品)很少,因此导致了盘算机视觉的饱和。

当应用的领域被逐渐开发,産品逐渐增多,现在的饱和就酿成了暂时性的饱和。从産品、市场的层面上也会进一步推动学术研究(技术)的生长。


那有待开发的领域和産品有哪些呢?

我们对盘算机视觉的应用还只局限于当下,我们正因为它目前需要庞大的数据集训练,昂贵的算力,才限制了我们对它的应用场景和産品的想象。

當日後算力成本降低,數據不足的問題获得緩解,我們會發現,其實計算機視覺可應用的場景很是多。


从我的角度来看,它在未来 能与机械人结合,我指的机械人并不只是人形机械人,主要是种种智能化设备,如场景监控,服务机械人,无人驾驶,醫療設備,嵌入式设备等。


想想许多科幻電影,機器人可以對一個環境進行各種分析,然後做出相應行爲。當然,這對人類來說,賦予機器人電影中的這些能力是一件很可怕的事情,就目前來說,也不現實。


微信图片_2022021009172912321.jpg

此圖來源于網絡,侵刪


不過,一些小範圍的能力我們是可以給的。


目前已經有的一些應用是對監控進行分析,檢測到如車禍,火災,槍擊案,養老院的老人摔倒等異常事件後自動報警。無人駕駛上的視覺等。


京東啓動了一個對豬臉識別的項目,對豬的康健狀況進行檢測。斯坦福對人的糞便識別檢測,從而判斷人的康健狀況。


微信图片_2022021009174244444.jpg

此圖來源于網絡,侵刪


以後可以有以下應用:


對二手車進行全面掃描,識別型號,給出新舊水平分析,從而給出相應報價。


对脸部扫描,分析脸部皮肤情况,给出适合其皮肤的照顾护士方案。对头发扫描,推荐相应的护发産品与护发方案。


對農田進行實時監控,提醒農場主目前農田的情況,如蟲子,作物生長狀況,分析該地區往年氣候,給出對該地區農田的Z優打理方案。


学跳舞,将老师的跳舞输入作为模板,对学生学舞視頻进行分析,给出跳的差池的地方。


……     ……


還可以有许多许多的應用,我給的都是些很細很具體的想法。實際上可以用上視覺的地方,都是計算機視覺的潛在應用領域。


我個人經曆有限,設想也不夠全面,但我相信社會上還存在许多可以用視覺來解決的事情。


這些事情都需要有一個配合的基礎,就是可以將視覺用于移動端設備,嵌入式設備。


微信图片_2022021009175155555.jpg

此圖來源于網絡,侵刪


從我的理解來看,日後硬件水平會有較大發展,用于深度學習的專用處理器會有較好的性能。


在嵌入式方面還有许多傳感器,可以與視覺圖像進行多模態的融合,從而彌補在純視覺方面算法上的许多缺陷。例如具體場景下可以增加许多如溫控、超聲波、激光雷達等傳感器,模型將傳感器的數據與監控圖像進行融合,還可以進行多攝像頭實現多視角融合進一步提升准確率。


此外,當應用在许多牢固的、封閉的場景下時,不需要滿足泛化性,也不需要檢測许多的類,就可以針對這個場景放心的做一個類的過擬合,從而將准確率提高到99。如果具體場景中具備高速網絡的條件,還可以將模型放在雲端。因此,單純地講模型只有七八十的准確率而無法落地的觀點是太過于片面的。


計算機視覺未來的應用場景很廣泛,我們需要對每一個具體的應用場景設計一個很小的,專一的,可以用于嵌入式設備的模型。模型小型化,模型輕量化,模型檢測實時化,模型多模態化。


商汤和旷世,作为AI四小龙的一份子,作为一个企业,将技术落地应用是它们的责任,不管是从规模上,人才供应上,资金上,它们也 有能力去将盘算机视觉与机械人,移动端,嵌入式设备端结合开发新领域,研发新産品。


就目前互聯網企業來說,AI四小龍也是Z適合做這件事的。


文章來源:新機器視覺(*如有版權問題請聯系後台,將在24小時內刪除文章)



获得更多産品支持与培訓

加入WELINKIRT

是否有任何疑問?

世界各地的WELINKIRT代表可以隨時爲您提供支持,滿足您的視覺和工業讀碼需求。

聯系九游会官网平台