關於各種連結,為什麼我要寫這個?#
這是一個新的系列文章。在這個系列中,我將分享我通過閱讀 RSS 發現的有趣文章、項目和論文。我要感謝DIYgod的RssHub和Miniflux,使我能夠自由且有效地從互聯網上閱讀引人入勝的內容。
Tyler Cowen 經常在Marginal Revolution上分享有趣的連結和簡短摘要。我還從Simon Willison那裡獲得了有價值的 LLM 領域的新聞。
受到這些博主的啟發,我想以類似的方式分享我的個人興趣。這些文章最初是我的閱讀筆記,但分享它們可以作為組織內容的有效方式。除了有價值的信息,我的連結收藏還包括我覺得有趣的東西。
如果我的文章能讓更多人獲得一些有趣的更新,那就太好了。我也歡迎各種主題的討論,因為我相信這對我們所有人都是互利的。
Miniflux 閱讀#
-
replit-code是一個專門用於編碼的因果語言模型。我實際上對 LLM 的因果部分更感興趣。
-
微軟設計了一個從互動中推斷獎勵的方案,可以在這裡查看。如果你可以將其用作真實世界互動的訓練部分,那就看看吧。
-
強烈推薦閱讀有關 LLM 當前發展的谷歌泄露文件。基本上,谷歌認為開源的 LLM 正在快速發展,並且具有幾個優勢,這是谷歌或 OpenAI 的封閉源 LLM 所無法提供的。我個人很興奮開源社區在 LLM 競爭中展示出的巨大力量,這最終可能恢復研究領域的開放性,並使我們對 LLM 如何影響我們的生活有更多控制。
-
SparseGPT可以修剪 LLM 的重量高達 60%,而無需重新訓練。
-
Chip Huyen 在這篇文章中討論了更多關於 RLHF 的內容。Chip Huyen 是一位寫有價值文章的博客作家,我沒有時間全部閱讀。她還在 2022 年分享了她的書單。
-
Reality bytes 的這篇文章介紹了卡爾曼濾波器。
一些奇怪的東西...