BigCode釋出僅有11億參數的高效能程式語言模型SantaCoder

開放科學合作組織BigCode釋出了一個用於程式開發,具有11億參數的,能夠產生比更大型開源模型,更好的Python、Java與JavaScript程式碼生成和填充建議。BigCode現在於Huggingface網站提供SantaCoder演示,供任何人研究試用。

SantaCoder使用The Stack資料集訓練,由於研究人員想要訓練出一個相對小的模型,因此僅選擇目前流行的三種語言Python、Java與JavaScript。在訓練模型之前,研究人員先註解400個範例,並且建置完善的正規表示式規則,從程式碼中刪除了諸如電子郵件、金鑰和IP地址等敏感資訊。

研究人員藉由實驗不同的因素對模型造成的影響,發現有兩個做法能夠顯著提高模型效能,第一是積極過濾重複專案,另一項則是不篩選GitHub專案星數,研究人員表示,如果只選擇GitHub 5星專案的檔案,模型效能反而會明顯降低。

模型訓練完成後,研究人員使用MultiPL-E基準評估模型,MultiPL-E是一個支援18種程式語言的文字轉程式碼基準。SantaCoder從左至右生成和填充MultiPL-E中Python、Java與JavaScript部分程式碼,評估實驗證明,儘管SantaCoder只有1.1B,但效能優於規模較大擁有67億參數的InCoder,以及參數27億的模型CodeGen-multi。

金誠貨櫃實業社

以客為尊,客製化的設計與服務搭配專業的工班,能夠提供全方位的貨櫃屋組合方案、貨櫃屋改裝及裝潢設計配合您的需求打造出一個完善的居住空間

臭氧機的滅菌效果如何?

多加科技公司,從事水處理、加水站設計規劃營運,以臭氧機、紫外線燈作水質淨化、殺菌設備,因臭氧機具強大氧化、殺菌、除臭能力,省電、無耗材費用,深受水處理業者採用

建南和著重於工業用機械手臂、工業型無線充電裝置、精密加工元件等產品之經銷、代理、進出口貿易

示波器探測執行效能最佳化的8大秘訣

瀚誼科技致力於提供示波器多元化的專業測試和解決方案,範圍涵括無線通訊系統、RF量測儀器設備、高頻配件、電子元件

SantaCoder使用開發和負責任人工智慧授權OpenRAIL,更重要的是,由於要讓開發者可以安心的使用SantaCoder,研究人員開發了一個程式碼歸屬查詢介面,讓用戶可以查詢SantaCoder生成程式碼的歸屬。

當開發者使用SantaCoder產生程式碼的時候,結果可能包含預訓練資料集程式碼的副本,研究人員提到,在這種情況下,程式碼的授權可能會要求開發者遵守部分要求,而透過使用程式碼歸屬查詢功能,用戶便可以找到程式碼的來源,遵守程式碼庫特定授權要求。

https://www.ithome.com.tw/news/154890

選擇好的茶葉罐,有效地保持茶葉的鮮度與風味!

茶葉罐的一般有錫製、鐵製、陶瓷、玻璃、紙製等,其中以選用有雙層蓋的鐵製彩色茶罐和長頸錫瓶為佳,用陶瓷器貯存茶葉,則以口小腹大者為宜。

【找人才】台北塑膠射出成型工廠徵選技師,薪資優,福利佳

射出成型機按外形特徵可分為立式、臥式、直角式、旋轉式和偏心式等多種,目前以臥式最為常用。

票選推薦煮婦最愛手壓封口機,省荷包不犧牲品質

意信臻以 品質、信用、親切、迅速、優質售後服務,為公司的營運宗旨。