关于各种链接,为什么我要写这个?#
这是一个新的系列文章。在这个系列中,我将分享我通过阅读 RSS 发现的有趣的文章、项目和论文。我要感谢DIYgod的RssHub和Miniflux,它们使我能够自由而有效地阅读来自互联网各个来源的引人入胜的内容。
Tyler Cowen 经常在Marginal Revolution上分享有趣的链接和简要摘要。我还从Simon Willison那里获取有价值的 LLM 领域的新闻。
受到这些博主的启发,我想以类似的方式分享我的个人兴趣。这些文章最初是我的阅读笔记,但分享它们可以作为组织内容的有效方式。除了有价值的信息,我的链接收藏还包括我觉得有趣的东西。
如果我的文章能让更多的人了解到一些有趣的更新,那就太棒了。我也欢迎各种主题的讨论,因为我相信这对我们所有人都是互利的。
Miniflux 阅读#
-
replit-code是一个专门用于编码的因果语言模型。我实际上对 LLM 中的因果部分更感兴趣。
-
微软设计了一种从交互中推断奖励的方案,infers reward from interaction。如果你能将其用作真实世界交互的训练部分,不妨看看它。
-
强烈推荐阅读有关 LLM 当前发展的谷歌泄露文件。基本上,谷歌认为开源的 LLM 正在快速发展,并具有几个优势,而谷歌或 OpenAI 的闭源 LLM 无法提供。我个人对开源社区在 LLM 竞争中展现出的巨大力量感到兴奋,这最终可能会带回研究领域的开放性,并让我们更好地控制 LLM 对我们生活的影响。
-
SparseGPT可以在不重新训练的情况下剪枝 LLM 的权重高达 60%。
-
Chip Huyen 的一篇文章,讨论了更多关于 RLHF 的内容。Chip Huyen 是一位博客作家,有很多有价值的文章,我没有时间全部阅读。她还分享了她在 2022 年的书单。
-
Reality bytes 的一篇文章,为你介绍卡尔曼滤波器。
一些奇怪的东西...