過去曾受益於許多面試經驗,現在輪到小弟出社會面試了,前來回饋心得。個人背景:115應屆CS碩,雜事纏身拖到10月才開始面試,研究領域為 Computer Vision 相關,碩論做 3D Object Detection 偏自動駕駛領域。104履歷設定不開放,只找 ML/CV 相關職位主動投(關鍵字:AI、機器學習、深度學習、電腦視覺,以及上述英文),鎖定台北區域,有過濾掉不少看起來有風險的職缺。
以 tf.data 優化訓練資料輸入管道 丨 2018 Google 開發者大會
本篇文章受掘金邀請撰寫,更多GCC 2018演講介紹歡迎前往:2018 Google 開發者大會 掘金專題
GDD 2018 第二天的 9 月 21 日 ,陳爽(Google Brain 軟體工程師)為我們帶來了《以 tf.data 優化訓練數據》,講解如何使用 tf.data 為各類模型打造高性能的 TensorFlow 輸入渠道,本文將摘錄演講技術干貨。
基於 Python 的 tf-idf 文字探勘演算法實現:以《笑傲江湖》為例子
Figure 1: 輸入「笑傲江湖」文件集合,每份文件為小說中的一個章回,輸出每章前 K 高的字詞和其權重。
簡介
tf-idf(term frequency-inverse document frequency)是一種用於資訊檢索與文字探勘的常用加權技術,為一種統計方法,評估字詞對於「文件集合」或「語料庫中的一份文件」的重要程度。詳細方法和公式可參見Wikipedia,不再贅述。
本項目為實作 tf-idf ,輸入給定「一組有特定集合關系的文件」(例如某本小說),輸出為每份文件的 tf-idf 權重值結果,具體為顯示前 k 高的「字詞」和其權重值,如 Figure 1 所示。另外也可以輸入某個字詞,輸出該字詞在所有文件中的權重值。
東方Project原曲MV線上生成播放器
Repo:https://github.com/Jasonnor/th-music-video-generator
連結:https://jasonnor.github.io/th-music-video-generator
動機
最近想做個東方原曲個人向Top50,編排MV過程中,覺得部分元素可以自動化產生(例如進場配圖、遊戲畫面皆能爬蟲取得),而且比較少有同時包含配圖和彈幕畫面的原曲MV(個人認為彈幕也是欣賞東方原曲不可缺少的要素之一),於是萌生了這個項目的概念。