好资源和短想法
https://arxiv.org/abs/2305.18290 #llm #ai

今天深入学习了 DPO,再次感叹扎实的数学功底对 AI/ML Research 的重要性……

原始的 RLHF 是用 pairwise human preference data(A 和 B 哪个更好)去训练一个 reward model,然后用 RL 来训练主 model,objective 是 maximize reward / minimize negative log likelihood 加上 regularization。比如 PPO 就是通过新旧 policy 之间的 KL Divergence 来做 regularization。而且还需要一个 critic model 来预测 reward。这套流程涉及多个模型,而 RL 又是出了名的难搞。

DPO 的思路是,观察到 RLHF 的 objective 本质上是 minimize loss over (latent) reward function,通过一番 reparameterization 等数学推导,重新设计了一个 minimize loss over policy 的 objective,直接绕过了中间这个 reward model,让 gradient update 直接增加 winner response 的概率并降低 loser response 的概率,大幅简化了流程。

拓展阅读:
- KTO: 更进一步,不需要 pairwise comparison,只用对 individual example 的 upvote/downvote 也可以学习到 preference。
- IPO: 解决 DPO 容易 overfit 的问题。
Voicenotes丨AI 加持的语音笔记记录软件
https://voicenotes.com/?via=yandhi

最近入了款 AI 语音笔记软件 Voicenotes,它完全迭代了我的灵感笔记采集以及某些特定工作流的内容记录场景,号称最聪明的笔记采集工具,由 Buy Me a Coffee 的作者 Jijo Sunny 建造。

Voicenotes 可以无压记录任何语音并转述文本,你可以使用内置 AI 总结/分重点/理待办/生成推文和博客内容等。其中的个性化 Ask my AI、搜索系统以及每条语音的 Related notes 完全可以将你的灵感内容和输入统纳链接起来,邓布利多的冥想盆(Pensieve)这里再次显喻。

整体而言,Voicenotes 极简丝滑的风格/多端输入的场景/标签链接的整合都深得我心,尤其我这种每天充满大量信息噪音、输入倦怠、呓语和回响的状态,太需要无压卸载了,这也是我上次分享「Speech to Roam」插件那么欣喜的原因。目前我正在简单记录,晚上复盘时间完全使用 Voicenotes,太适合日记和个人状态评估了,以及某些交谈和重要会话都无压整理,完全的升级版「通义听悟」和「AudioPen」。

我比较看好这个笔记软件,已经放置手机底部停靠栏。目前入的 Voicenotes Believer 终身使用 50 刀,本身月付 10 刀,感兴趣可以入个终身,现在每月 AI Chatbot 都 20 刀,Voicenotes 还加持的 GPT4。记得可以通过分享上面我这种自己的 refer 链接以获取佣金。

相关链接
1 Speech-to-Roam丨Roam 语音转文本/调用 AI与笔记对话插件
2 为什么你应该开始用 ChatGPT 写日记|做笔记(Prompt 和自动化)

#TfT #AI
#AI #Tools #Web

🧠 Refind - 个性化的优质内容发现平台

Website

🌟 Features

- 利用机器学习,每天推送若干篇可能感兴趣的高质量文章
- 聚合了多个领域优质信息源
- 支持导入 Pocket 等平台的收藏,让个性化推荐更精准
- 提供高亮、笔记等实用功能

在这个信息过载的时代,优质内容的发现成为一大难题。RSS 等工具能带来信息广度,但良莠不齐,筛选成本高。算法推荐虽然方便,却可能加剧信息茧房。Refind 则致力于在两者之间寻找平衡。Refind 从你的阅读行为出发,建立个人兴趣模型,再从汇聚的海量优质信息源中挑选出最匹配的内容。个性化是 Refind 的一大特色。除了智能推荐,它还支持导入 Pocket 等平台的收藏,让兴趣模型更加完善。

类似其他的阅读应用,Refind 还提供高亮、笔记等实用功能。同样也提供文字转语音,但效果很差,远不如 Omniover。移动端 App 是套壳 Web,使用体验不佳。

Refind 提供收费订阅,但是在功能上我没觉得和免费账户有什么很重要的分别。订阅价格是 9.99 USD/Month,或者 366 USD 永久。这个价格非常昂贵,但有意思的事是 Refind 允许通过邀请新用户来免费获得订阅。你可以用我的邀请链接来注册 Refind,我们都会获得 Refind Coins 奖励。

Refind 中不包含任何中文内容。如果你想学学英文,扩充一下视野,欢迎通过我的邀请链接来注册使用 Refind。

频道:@NewlearnerChannel
#Readwise #AI #APP

🔗 Readwise Reader 更新:中文 AI 摘要、自订 Ghostreader prompts

🔖 一站式的阅读工具 Reader 迎来了有感更新。以往在 Reader 上的内容虽会自动产生摘要,但输出的结果皆为英文。现在开放自订后,终于可以设计自己想要的 AI 摘要模式。

📍 于是我自行设计了一套「不只是摘要的」 Prompt 语法,除了最基本的内容摘要,还加上了「高亮重点引入」+「设计问答模块」,让产出的内容更个人化、也更能增加吸收成效。以往只能从文章标题或点进去快速浏览来判断这则 feed 要删除、封存还是稍后阅读,一篇通常要 30 秒,现在能直接从内容列表的「个人化摘要」判断,大幅加速了我内容筛选的效率。

​1. Reader 中文 AI 摘要应用&原本自带的对比差异
​2. 为什么不要让 AI 自己无脑摘要?Prompts 语法解析
​3. 怎么使用我撰写好的 Ghostreader Prompts?

作者频道作者电子报
信息香料丨最近正在挖掘的信息源

「得香料者,得天下」,香料是「沙丘」世界中的稀有资源,一种具稀有生产性的麻醉药物,它通过「沙鳟 Sandtrout」的排泄物与水融合而成。好的「信息源」则是经过与无数「注意力」融合、萃取和咀嚼的「早期香料」,它作为「摄入」隐喻。

我对这种「摄入」极其敏感,它与注意力和信息源质量相关。前面我经常提到我定期对信息源进行「RSS 动态调整」,挖掘和祛除,下面是我最近正在吸收的内容,内容太多就直接分享这些信息矿。

TIME 100/AI
时代周刊评选出的 100 名人工智能领域最具影响力的人物,重点关注AI 热潮最前沿的行业领导者如 Dario/ Sam/ 黄仁勋这些 CEO,全球试图利用 AI 应对社会挑战的创新者如特德姜和众多艺术家,以及致力于解决有关 AI 使用的深刻道德问题的个人思想家如 Yann LeCun/ Geoffrey Hinton。本来想制作个 X list,发现已经有人制作,可直接关注:TimeAI 100/ TimeAI100-Thinkers

Readwise Twitter Leaderboard
Top saved tweets
Top threads saved
Readwise 推出的最高推文收藏和最高线程收藏的 TOP1000 X 账号,可以挖掘很多经典的账号内容。

Reading List 完整版 | 42 章经
最近看到公众号「42 章经」关于 AI/ VC 相关的新闻/博客以及众多信息源分类,比较丰富。

公众号文章萃取丨神经现实/利维坦/阵地LeFront
我已经不看公众号,不过最近想挖掘之前看到比较有趣的三个公众号,就通过某宝爬取了这些公众号的所有文章,然后单独看信息源。最后发现神经现实和利维坦这两个公众号和我现在阅读的源太多重合了,已经爆破完了,感兴趣可以自己查看。(Excel 分享在评论区)

我上篇文章「2023 信息源合集」是与我注意力融合而成的「信息香料」,可结合处理。「摄入」的关键是吸食和使用,信息源和知识一样,本身没有价值,要知道的是信息和香料只存在于「行动萃取」当中。

相关链接
2023我的所有信息源及其生产力模型丨容器、花园和通用生产流范式

#RSS #AI The 100 Most Influential People in AI 2023
全局 AI Copilot

现在 AI Copilot 越来越舒服,响应也很快,成熟太多了。图示是我使用 Glarity AI 在 RemNotes 中处理一些单词和内容记忆,比起 RN 自带的 AI 舒服很多。记忆的本质在我看来是神经连接,刻录和提取过程,AI 在辅助记忆过程中可以与你对话和提供各种意义连接,更多的触发神经亮区,达到记忆效果。

之前都介绍过,不过这种全局 AI Copilot 目前确实非常实用了。弥补了太多软件没有加持 AI 的不足,尤其常用工具和笔记软件,划取使用体验极好。搜索、解释、翻译、总结,太多工作流程中的轻量 AI 使用场景,而这就是全局副驾驶的功能作用。加上条,目前我阅读系统、记忆系统都可以很好的融入这些,但真正写作和处理文本时,GPT3.5 API 很受限,深度补充/思考发散/溯源求证都需要更好的模型,这个时候直接用 GPT4 和 Perplexity 会好很多,多模型交叉使用和佐证是使用 AI 条例之一。

目前体验最好的个人感觉还是 Glarity,非常干净优雅,以前分享过的 Sider/ Monica 现在也非常强了,功能都非常丰富,比如全局输入框调用(我之前叫做 Notion AI 系插件),现在基本都有,按需使用。

相关链接
0 通用生产流范式(General Workflow Paradigm)
1 AI 影响我阅读文章的方式
2 阅读输入工具的 Combo丨翻译、总结、全局和 AI
3 Chat-GPT 全局网页侧边栏插件丨调用重器

#AI #RSS #SRS #TfT
优化 ChatGPT 体验丨我的网页脚本和插件使用 Combo

当我高强度使用某个工具时,我会对这个工具插件/脚本和界面样式进行折腾,进行某种程度的体验优化。这种可能有害,很多功能在产品迭代后可以替代这些,就像 Sam 提醒不能过分依赖以现有 GPT4 功能扩展作为初创业务一样,毕竟 GPT4.5 这些先进模型出来就会让这些业务直接凋零。

不过有现成的轮子直接用就完事,今天分享我现在 ChatGPT 网页端使用体验相关插件和脚本,我一直遵从剃刀原则处理这些附加内容,我不再使用相关 Prompt 商城插件这些,现在我使用全局「魔法书」以及 GPTs 这些都可以很方便处理 AI 使用相关提示。

ChatGPT 问题导航侧边栏
ChatGPT 问题目录,对你会话中所有你发送的内容进行导航,还可以折叠,更像个原生功能。

KeepChatGPT
这个非常强,最主要的两点:一是可以优化报错和警告功能,使用后确实可以输出很多长内容也很少报错,以前 ChatGPT 经常抽风。二是有个「克隆对话」可以直接点击会话中的头像,就可以直接复制文本,对于优化提问都是很有帮助,这个可以配合 ChatGPT 新功能 Quote 可以直接划取它的回复进行引用提问,如 Telegram 的引用功能。其他 UI 优化这些都很不错。当然这个插件有个 Banner 你可以使用广告拦截插件 uBlock 自定义取消,或者使用这个脚本 KeepChatGPT Disable Banner

ChatGPT Exporter
ChatGPT 导出插件,你可以批量导出也可以用各种格式,对于演示和展览非常有用。

Prompt 全局「魔法书」
界面丨我如何丝滑地拉起我所有互联网界面和内容
AI Prompt 全局工具
这个我之前有分享,就是使用 Qucker 动作进行提示收录和发送,这个完全不需要单独的插件,因为 AI 是跨多重领域和软件的。

---
最后欢迎查看我的 Combo 系列,关于我常用工具的使用优化。

相关连接
1 Telegram 频道内容发布的工具 Combo
2 Github Combo 工具使用
3 Hacker News 的使用 Combo
4 YouTube 的使用 Combo
5 X/ Twitter 使用 Combo
6 阅读输入工具的 Combo丨翻译、总结、全局和 AI

#productivity #AI
AI + RemNote丨SRS 未来框架/自身作为方法的软件实体/未来学习引擎

RemNote 再次加强,最近已开始内测原生文本制卡功能 AI Flashcards(Labs 启用),直接爆破我之前的 AI 外挂插件。

如视频演示,RemNote AI 制卡可以直接处理单词/多文本句和段落,处理形成基础卡,概念描述卡(Concept Cards),填空卡等内容。同时也能制卡时使用快捷键 TAB 快速调用 AI 处理文本,以及生成处理建议。目前 AI Flashcards 对中文支持较弱,会直接生成英文内容等,不过对 AI 语言模型功能调整都是小事。

RemNote 作为一款间隔重复·双链大纲笔记/学习软件,目前真正迎来了它的高光时刻,已为 SRS (间隔重复系统)未来框架指明方向。RemNote 本身的笔记软件框架结合创新的 Rem 特色,已经足以让各种方法论/ PKM / PIM 文本实践在上面绽现,而 RemNote 更核心的是其闪卡间隔记忆系统的完全且近乎完美嵌入,让 SRS 系统真正在载体实现上完美寄存。目前 AI 加持的重点是减少「摩擦」,AI 在生产力处理上目前核心功能也是优化所有现存实践的 Workflow「摩擦」,当过去你的工作流越低效,越是复杂实践且处于混沌,AI 接管优化的程度就越大。SRS 系统过去的软件实践存在太多这种摩擦,批量制卡/卡片解释/卡片拆分/卡片整合/卡片描述/补充翻译等等,当摩擦超载,AI 介入的优势将更加明显且无需逆转。而其它笔记直接接入 AI 接口的文本处理,意义就逊色太多。

更重要的是,RemNote 已经成为将自身作为方法的软件实体,拉起了更多学习引擎。RemNote 有自身一套学习框架,概念解释和描述,拆分和合并,真正的结构化/原子化处理知识,符合助记媒介结构化实践以及卡片管理方法论行施。RemNote 每条闪卡正背面都有单独的 Metadata,而 SRS 核心即是数据化和应用表达。

RemNote 如同邓布利多的冥想盆(Pensieve),器物/记忆/存储和提取的装置,未来学习的魔法引擎。

RemNote +AI 已经近乎完美融合间隔重复等多种系统功能(目前又在内测 Exam Scheduler 新功能),Anki/ SuperMemo/ Quizlet 间隔记忆工具以及如 Duolingo/ LingQ 语言学习以及应试等工具,相形失色,不属于同个时代。我对 RN 目前定位很简单,生产力小众领域的进阶之路,且 SRS 将不再小众,如同 Roam 带起 Zettelkasten 知识管理方法论一样,RemNote SRS 也将作为与 ZK 同级且可融合的方法论学习实践出现,并最终走上属于 SRS 影响力殿堂。

(最后感谢朋友的 RN 学习建议 @ottodiangun

Reference
RemNote 介绍
SRS丨数字时代的第四座生产力花园
数字时代的三座生产力花园
SRS+AI丨全局 AI 调用/我的记忆系统再次加固
通用生产流范式(General Workflow Paradigm)

#AI #SRS
关于 AI 内容的超级聚合网站
AII AI News

这个只能说非常爆炸,关于 AI 的趋势/新闻/播客/视频,很多网站 AI 内容的聚合展示。前面我也分享了「关于 AI 资讯信息」的小专题,学术新闻等内容。

以及群友推荐的这个网站:hackertab.dev,同样平铺关于 Github/HN/ProductHunt 的所有趋势内容,很解压。

加速就完事儿了,什么焦虑/FOMO 不存在的,解决这些问题的唯一方法只有继续加速。

Reference
关于 AI 的资讯信息

#AI
同义词「Thesaurus」分类辞典与写作提升

最近看到一篇文章「How to use a thesaurus to actually improve your writing」,提到了同义词「Thesaurus/Synonym」辞典在写作中的使用与提升。Thesaurus 这个词来自希腊语 thēsauros,意思是“金库或仓库”,可以使用的宝藏,但前提是学会「选择」。文中提到纳博科夫在写 Lolita 的时候会定期思量措辞,以把握句子的节奏、韵律「Rhythm」。

我之前就已分享过这类辞典,不管是同义词替换的「汉语反向辞典」,还是根据文本查相应句子的「据意查句」;亦或是英文版的同义词替换「Power Thesaurus」和英文版据意查词的「What Word Is That?」,都是这种工具,包括押韵网站 Rhythm。同样的,AI 也在参与这种分类辞典补充,DeepL Write 就是明显例子。我写作中有时也会用到,总有一些措辞需要推敲。当然,这些也可以直接问 AI ,不过缺点可能是不会太全太准确(毕竟专业分类辞典更系统)。

reference

英文书写相关的语法检查、溯源、增强和替换。
DeeL Write AI

#tools #AI Stephen King’s most misused piece of writing advice
T0 级六幻神、工具梯队、生产力(2022)

晚上好,诸位。今晚整个活,分享我 T0 级的幻神工具和其它能作为工具而非玩具的应用。它们基本涵盖了我目前最满意、常用、常驻的软件、插件以及网址等程序。

虽然我之前不断分享工具,但真正有用,我会用的,只有那么“几十个”(不仅是软件)。这些不需要变成你的“绝活海”(游戏语,不需要都精通),当然更不要抱残守缺 All In One (“英雄勺”)。我关注系统和联系的力量,各种处理流程与相应工具契恰形成系统,多个流程,多个系统形成复杂的环境,彼此的环境与系统即构筑起不断生成生产力量(Power)的发生器。所以探索自己的工具和流程吧,不需要都精通和使用,让少数盘织在你手上的工具熔铸成系统,反应和震颤,然后握住它,这即是生产力。

T0

我的六幻神。前几天介绍了“器霸”,我的五核心。今天再铸 OpenAI,Chat-GPT (专题)我的又一幻神。真的太强辽,它已经完全作为真正的生产力(已经在帮我处理一些工作内容),作为技术脚本与我记忆发生联系。她不是玩具 x3,她是我 T0 级工具的灵魂和血肉,今年年度不是 RWR,不是 Tana,是她。

Roam Research 双链工具,Notion 数据库展板Inoreader RSS 软件RWR (阅读器),Supermemo 间隔重复系统,这些都是数字或知识工作者应该拨开的工具迷雾和生产力之门,收益颇丰的投资。这即是 T0 的原因。

T1

这一层是普遍核心,具有普遍性的常驻核心,WIN 端系统枢纽。 以 Fluent Search 咒语Quicker 吟唱拉起整个 PC 应用和生产通道。没有它们我会“赛博窒息”,第四个即代理工具 Clash,这一层都是馈赠和惊喜。

T2

这一层是新兴核心,改变某种习惯的应用(我之前提过改变某种习惯的应用都值得去适应)。

探索者小舒:我搜索系统的核心。
Speend Dial 2:非 RSS 订阅的网站展板。
闪击工作台 Sankki:我的工作空间。
Metaphor:我搜索系统的 AI 常驻。
LingQ:语言学习工具,学习专题
Figma:设计师的平民级利器,重器。
Excalidraw:极舒服的白板工具,现在非常强(协作、网络笔记拖拽处理演示),比其 Miro 这些更轻量。

T3

Calibre、Zotero、Eagle,我的分类库,书籍、文献、图片以及一个阅读器 Xoodo(Reader PDF 阅读太差,就还是用这个读 PDF). 仍是主要应用。

T4

这一层是插件核心,常驻。插件管理器油猴必装广告屏蔽沙拉查词DeepL(网页翻译和书写翻译会用到)

T5

这一层主要是电脑托盘常驻,开机常驻。百度输入法(双拼支持好,符号补全好,输入法我看这两个),有道翻译(全应用查询),ABBYY(PDF 扫描,这个确实挺大帮助),Cubox(移动端传输还在用),KeywordSea(同 Metaphor 一样,搜索的 AI 常驻,不过还没用起来,但确实强)。Snipaste(常驻截图工具)。
---

以上。这些确实让我创作欲望增加,但就像胆固醇隐喻,它也在反噬,这次算大总结。本次图片制作工具是 TierMaker,音乐专辑排行、游戏版本答案以及其它层级梯度都可以用这种图。最后期待兄弟们的工具排名和其它分享。

#tools #AI #productivity
1️⃣ Public API Lists

该仓库汇总了很多公开的 API。#API #github

2️⃣ The Ubiquitous B-Tree

这是一篇普渡大学在 1979 年发布的计算机科学论文。通过这篇论文,你将了解一种名为 B-Tree 的基于磁盘的索引结构及其变体,这篇论文很好地解释了为什么这些年来 B-Tree 如此成功。#论文 #B_Tree

3️⃣ ffmpeg.wasm

ffmpeg.wasm 是 FFmpeg 的纯 JS/WASM 接口,你可以使用它在浏览器里运行音频和视频多种格式的录影、转换、流功能。#FFmpeg #WebAssembly

4️⃣ prettymaps

prettymaps 是一个 Python 库,它可以依据 OpenStreetMap 数据来绘制定制化的地图。README 里展示了几张由这个库绘制的地图,非常漂亮。#地图 #Python

5️⃣ AI 写的 FPS 外挂

这段视频展示了一个用图像识别技术制作的外挂,这种外挂号称全平台通吃并且很难被检测出来。这样的外挂只要能接受游戏画面和操作鼠标键盘就可以运行,它不直接与游戏程序进行交互。不过,反外挂者也在积极通过 AI 来检测此类游戏外挂。两者之间斗争已经转移到了 AI 领域。#外挂 #AI