NLP(Natural Language Preprocessing)又稱為自然語言處理,常見的跨語言模型包含M-Bert、LASER、MultiFiT和XLM。由於工作專案中需要處理跨語言語料的問題(e.g. 文本當中包含了英文、法文、德文),因此開啟了 Cross-Lingual Word Embedding(跨語言詞嵌入) 的研究領域,Word embedding 是將字詞映射到一個向量空間,是一種 Word representation 的方式。
是資訊控也是一名資料科學家,現居上海。主要工作是以 DS 解決支付產業當中的反欺詐問題,最近在研究 Pyspark。假日喜歡找一間咖啡廳寫寫程式、研究技術知識。能從交流當中學習,是一件很棒的事情,如果你所研究的主題正好與我相關,歡迎找我一起聊聊:v:。