被投訴的AI志願卡,到底冤不冤? !
>>>模擬填報12萬樣本0落榜,平均過線4.2分不浪費
本站高考智願2.0,更精準的志願推薦系統,用好高考每一分!
截至目前,全國30省份高考分數線都已公佈,伴隨着志願填報季開啓,各式各樣的AI填報志願卡開始暢銷於各大平臺。
商家爲這些志願卡設定的營銷話術,大多是“100%準確”、“值得信賴”、“報考神器”、“AI助力”……
相比於動輒近萬元的1對1專家,只花費幾百塊的志願卡更能被普通家庭接受。但伴隨着用戶羣體的激增,投訴的頻率也越來越高。多位專業人士表示,數據不夠精準是這類卡的通病,很容易得出錯誤的結論誤導學生。
當以技術手段填報志願出現偏差,到底是AI失去了準星,還是另有隱情?
被投訴的智能推薦,是如何“坑”考生的?
在黑貓投訴平臺上檢索“高考志願”,兩百多條檢索結果中,有大約1/4的投訴內容針對這類志願推薦系統。具體的投訴細節主要分爲兩類:1、數據不全,2、推薦不準。
其中有一位用戶表示,自己根據某商家在抖音平臺售賣的志願卡填報了六所大學,該系統計算顯示六所大學的錄取率都在70%以上,結果只有第六所“保底”大學錄取了該投訴者,其高考分數高於錄取分數線20分。
誠如許多招生領域的專業人士所言,在確保數據準確的情況下,藉助大數據系統來填報志願的確可以幫助學生和家長省時省力。“從原理上來看,無論是個人收集的數據還是第三方收集數據,只要能夠保證數據的準確,AI推薦的結果就有一定的參考價值。”
但是,有參考價值的前提是數據的準確和推薦模型的合理搭建,這在信息爆炸時代並不容易做到。
北京某985高校的招辦負責人李老師介紹說,各類AI填報志願卡是基於何種算法、背後是何種系統家長們都不瞭解,也沒時間細究,所以推薦出來的基礎數據都有可能存在差別。
另外,直播平臺上售賣的志願卡質量魚龍混雜,有些商家的數據庫可能是沒有經過處理就直接錄入的數據,並未進行校對覈實,“如果連這一環節的根基都沒打好,就更不用說推薦的準不準確了。”
“失靈”的智能推薦神器,問題出在哪裡?
某志願填報領域的資深規劃師透露,自己從業過程中也需要用到大數據系統作爲輔助工具,但有很多可能性都會導致系統推薦不準確。
“如果考生不服從調劑,會產生退檔,退檔之後又產生了缺額,這就涉及到了徵集志願的錄取方式。這個時候學生的分數與正常報考的學生的分數的差距會非常大。”
例如,一所學校的某專業的錄取分數線爲600分,兩位徵集志願考生的分數爲550分,如果沒有把兩位考生的數據摘除掉就進行統計,就會產生誤差。因此,如果用單純的錄取分數數據匹配會誤導學生。
再比如,像上文提到的那位因“分數超出錄取線20分”而投訴某志願卡的考生,最終在“保底”志願才被錄取,確實浪費了很多分數。而在實際報考情況下,比最低分數線高出二三十分被錄取的考生並不罕見。
以2022年吉林高考爲例,理科考生小A以606分被吉林大學的經濟學類專業錄取,而該專業總共錄取35人,最低錄取分數線爲580分。小A以超出26分的成績被錄取,看起來也是一個“比自己高考分數低了二十多分的志願”,這種到底算不算“浪費分數”?或者換個說法,如果吉林大學經濟學類專業,也是系統推薦給小A的一個參考志願,那麼這一智能推薦算不算失誤?
這裡首先明確一個概念,每個大學或者專業的最低錄取分數線,也叫這個大學/專業的投檔線。大學投檔線,是某大學按照招生比例進檔的最後一個學生的分數,是按照國家統籌的錄取比例,根據所有學生的成績和想招錄的人數算出來的最低分數線。同理,專業分數線,是高校根據報考該專業的人的多少和考試分數高低排列,完成專業招生計劃最後一個人的分數。
專業錄取的規則是什麼?十二個字:分數優先、遵循志願、一輪投檔。先從最高分考生開始,依次檢索和投檔,當輪到檢索某一考生時,遵循該考生所填報的志願順序檢索,當符合投檔條件且院校有計劃餘額時,即被投檔。
舉一個直觀的例子,某高校招收物理和數學等3個專業,各招收1人,一共投檔3人,假設投檔考生成績及報考專業如下:
按照分數優先錄取規則的辦法,錄取順序如下:
第一步 在不看考生報考專業的情況下,爲所有考生按高考成績排一個隊,確定錄取順序,只能是:甲第一,乙第二,丙第三。
第二步 爲成績第一的考生甲安排專業:甲第一專業報考物理,尚空缺中,甲錄取到物理專業。
第三步 爲成績第二的考生乙安排專業:乙第一專業物理已經完成計劃,乙無法錄取到物理,再看乙的第二專業數學,尚空缺中,乙錄取到數學專業。
最後一步 學校的2個計劃已經完成,考生丙如果服從調劑,則安排其他專業,不服從則退檔處理,錄取工作結束。
因此,分數優先對進檔考生的最大好處是可以最大限度地保護高分考生,只要分數排名靠前,就可以按順序錄取到自己報考的專業中。而對於一些熱門專業,比如上面例子裡小A報考的經濟學,由於報考人數衆多,錄取人數有限,很容易水漲船高,出現最低錄取分和最高錄取分相差三四十分的局面。
“熱門專業”的錄取分數,爲啥差這麼多?
最能體現學科錄取分數差異的是綜合性大學。比如:北京大學和清華大學招生的本科專業有100個左右。這兩所大學裡,大家猜猜錄取分數線最高的是哪類專業?
清華大學錄取分數線平均分數最高的是經濟管理學院,北京大學在四川連續三年錄取分最高的專業是工商管理類。由此我們可以得出一個粗淺的結論:全中國高分段的考生,熱衷報考經管類專業。
GMAT考試的官方承辦機構GMAC曾在2016年-2019年接連發布調研報告,顯示過半的中國留學生在美國讀的是商科專業。這種現象其實並非中國獨有,全世界大學的商科都是熱門。
經管類專業,國際上一般叫商科,以金融、會計、管理、經濟學四大專業爲代表,有很多專業類別。目前在國內綜合性大學裡,商科依然是錄取分數最高的專業之一,也正因其熱門性和考生實際填報的多樣性,導致商科類專業容易出現“兩極分化”的錄取分數。
這一點我們用2022年的錄取數據就可以佐證。比如,山東財經大學的經濟統計學專業(理科),去年在四川錄取5人,最高錄取分和最低錄取分就相差了45分;上海應用技術大學(理科)工商管理類去年在四川錄取2人,錄取分數就相差了33分。
更極端的例子發生在陝西,河北工業大學2022年在會計學專業也是僅錄取了兩人,但這兩人的分數相差了73分!
出現這種局面的原因很有可能是:兩人雖然高考成績差了73分,但都將這一志願排在了志願表較靠前的位置,按照“分數優先,遵循志願”的原則被錄取。而兩人中間分數段的考生,在志願表專業排序上將該志願排在更靠後的位置,故而被其他志願錄取。
通過以上例子不難發現,在平行志願“分數優先,遵循志願”的原則下,志願表內志願的先後順序尤爲重要。這也是爲什麼許多填報專家和填報系統,在給考生推薦志願時,選擇以“衝穩保”來劃分結構。
就像本站傳媒自研的“本站高考智願”報考產品,在今年推出的2.0版本里,針對不同省份的志願表結構和填寫數量,靈活匹配了“衝穩保”各個檔位的志願比例,並按照推薦模型測算的錄取概率,爲每一檔位設計了區間劃分。VIP用戶在做出了個性化篩選後,直接可以進入志願表,查看已進行過智能排序的志願。此時的排序,不僅按照“衝穩保”進行了區隔,還在每一檔里根據考生的個性化偏好進行了權重排序。
通過本站高考智願的系統智能排序,考生得以將個人實力和個人訴求結合起來,確保在報考安全的基礎上,儘可能“不浪費分數填志願”、“用好高考每一分”。
據業內人士透露,本站高考智願也是唯一公佈了預測分數線與實際錄取線差額驗證結果的報考類產品團隊。以2022年浙江、吉林、陝西、上海、四川等5省的專業錄取數據作爲參考,該產品模型預測出的專業錄取分與實際最低錄取分的平均差值僅爲+4.2分,且無一人落榜。
但是說到底,志願填報本身是一個無法證僞的過程。任何一種被賦予技術手段的大數據系統,也只能作爲輔助工具;再智能的AI推薦、一鍵生成,也只是模擬填報,僅供參考。正如許多知名大學的招辦老師都曾對家長再三解釋的那樣——
“即使選擇了AI填報志願卡來輔助,也應該在報志願之前按照省招辦手冊去驗證系統的數據是否真實,最好是與學校招生辦打電話再次覈實。”