Py学习  »  Git

微软缩小了 JS Git 仓库;肖邦200年手稿被发现;You-get ;中国的汉字失忆症;比 Whisper 更高效地识别语音

超级科技迷 • 5 月前 • 164 次点击  

2024-10-28 Hacker News Top Stories

1. 我们缩小了 JavaScript monorepo Git 仓库大小 (We shrunk our Javascript monorepo git size)

https://www.jonathancreamer.com/how-we-shrunk-our-git-repo-size-by-94-percent/

本文是关于如何缩小 JavaScript monorepo Git 仓库大小的经验分享。作者在 Microsoft 工作,负责维护一个非常大的 JavaScript monorepo,称为 1JS。这个仓库有大量的代码和贡献者,导致仓库大小达到了 178GB,给开发者带来 了很大的困扰。作者通过实施两项措施来解决这些问题:首先,通过 pull request 修改 beachball 工具,减少 change 文件的数量;其次,编写一个 pipeline 定期清理 change 文件夹。通过使用新的打包算法,仓库大小从 178GB 缩小到了 5GB。

HN 热度 296 points | 评论 190 comments | 作者:kwantaz | 21 hours ago

  • • 新的 git-survey 命令目前仅在微软的 git 分支中可用,尚未合并到官方 git 项目

  • • full-name-hash 和 path-walk 功能也仅在微软的 git 分支中,尚未出现在官方 git 版本

  • • 微软的贡献不应被视为 Embrace, Extend, Extinguish(EEE)策略,因为这些改进是针对开源项目的

  • • 微软可能通过引入不兼容的特性来扩展 git,进而迫使用户使用他们的分支,这将使他们有能力控制 git 的发展方向

  • • 微软在 VSCode 上的行为可以被视为 EEE 策略的一部分,他们通过提供专有扩展来逐步削弱其他编辑器的竞争能力

2. 肖邦的新发现 (A Chopin waltz unearthed after nearly 200 years)

https://www.nytimes.com/2024/10/27/arts/music/chopin-waltz-discovery.html

肖邦的一份近200年的未发表华尔兹手稿在纽约摩根图书馆被发现,这是半个多世纪以来首次发现的此类作品。经过专家分析和多重测试,最终确认这是一首由名浪漫主义作曲家弗雷德里克・邦创作的华尔兹,估计创作时间在1830年至1835年之间。

HN 评论 88 comments | 作者:perihelions | 11 hours ago

  • • 这首新发现的华尔兹确实很好,与其他新发现的乐曲不同,它几乎是一首完成的作品,具有明显的肖邦风格,并为肖邦的作品增添了新的元素

  • • 首次演出应该更注重文化意义,可以与波兰当地的文化组织合作,或者选择一位来自肖邦故乡的年轻钢琴家来演奏

  • • 肖邦的华尔兹和玛祖卡都是三拍子的舞蹈形式,但华尔兹的节奏更稳定,强调每小节的第一拍

  • • 音乐专家可能仅凭声音就能识别出这是肖邦的作品,因为每位作曲家都有独特的风格

  • • 肖邦的钢琴作品非常创新,他发明了许多新的演奏方法,波兰的影响和沙龙音乐的风格也非常独特

3. 我的 FM-RDS 之旅 (I discovered mysterious hidden signals on a public radio channel (2013) [video])

https://media.ccc.de/v/30C3_-_5588_-_en_-_saal_g_-_201312281600_-_my_journey_into_fm-rds_-_oona_raisanen

演讲者 Oona Räisänen 分享了她如何在公共广播电台上发现神秘的隐藏信号,并通过硬件破解、逆向工程和密码分析,最终揭露了这些信号的意义。

HN 热度 247 points | 评论 63 comments | 作者:joebig | 23 hours ago

  • • 这个演讲非常有趣,演讲者通过频谱分析器发现了 FM 频道旁的奇怪信号,并尝试解码 RDS 标准,最终发现了一些与公交相关的信息

  • • 解开谜团的乐趣是获取知识的主要驱动力

  • • 真正的高手是那些对未知事物有自然兴趣并能系统地解决问题的人

  • • 很多人不理解为什么有人会对解码 FM RDS 这样的项目感兴趣,认为这是折磨

  • • 如果数据被加密,有些人会继续尝试解码,但具体方法取决于个人兴趣

4. You-get: Dumb downloader that scrapes the web (You-get:傻瓜下载器,用于下载 Web 媒体内容)

https://github.com/soimort/you-get

You-get 是一个小型的命令行工具,用于从 Web 下载媒体内容(视频、音频、图片),在没有其他方便的下载方式时使用。它支持多种网站,包括 YouTube、Youku、Niconico 等,支持多种格式,包括 MP4、WebM 等,支持多种质量, 包括 1080p、720p 等。

HN 热度 197 points | 评论 76 comments | 作者:Anon84 | 10 hours ago

  • • 仅下载音频流可以节省 90% 的带宽成本

  • • Brave Mobile 浏览器支持后台播放视频音频,无需订阅 YouTube Premium

  • • Firefox 浏览器可以通过 video-bg-play 插件实现后台播放

  • • GrayJay 应用可以实现类似功能

  • • yt2pc 项目可以将 YouTube 播放列表转换为播客兼容的 URL

5. Character amnesia in China

https://globalchinapulse.net/character-amnesia-in-china/

中国的汉字失忆症

在中国,人们越来越多地忘记如何书写汉字,即使是受过良好教育的人也会出现这种情况。这种现象被称为“汉字失忆症”。本文探讨了汉字失忆症的原因和影响。

HN 热度 177 points | 评论 147 comments | 作者:nabla9 | 21 hours ago

  • • 作者提到的忘记如何写“嚏”字的情况在中国很常见,即使是高学历的人也会遇到

  • • 日语和中文的书写系统中,由于字符数量庞大且笔画多,人们容易忘记如何书写,这与人类记忆的限制有关

  • • 书写系统的不稳定性并不影响语言本身,因为正字法只是语言的辅助工具,韩国的例子证明了这一点

  • • 数字化输入法在日常生活中帮助人们书写汉字或日语汉字,减少了记忆字符的需求

  • • 英语中也存在类似的问题,如拼写和发音的不一致性,以及需要前后文来理解句子的情况

6. 糖业在 50 年前通过付费科学家将健康问题归咎于脂肪 (50 Years Ago, Sugar Industry Paid Scientists to Point Blame at Fat)

https://www.npr.org/sections/thetwo-way/2016/09/13/493739074/50-years-ago-sugar-industry-quietly-paid-scientists-to-point-blame-at-fat

1960 年代,美国糖业协会秘密资助哈佛大学研究人员进行研究,以淡化糖对心脏病的风险,并强调脂肪的危害。研究人员在《新英格兰医学杂志》上发表了一篇论文,没有披露糖业协会的资助。该研究审查了各种研究和实验,得出结论,减少脂肪摄入是预防冠心病的最佳方式。

HN 热度 172 points | 评论 140 comments | 作者:Tomte | 9 hours ago

  • • 糖业在 50 年前通过付费科学家将健康问题归咎于脂肪

  • • 低脂食品趋势延续至今,但糖分含量并未减少

  • • 多个行业曾扭曲事实,包括烟草、石油等

  • • 香蕉公司在中美洲通过破坏民主来获取资源

  • • 肉类行业正在推广“糖业欺骗你”和“饱和脂肪有益健康”的观点

7. 写作和未来的写作技能 (Writes and Write-Nots)

https://paulgraham.com/writes.html

这篇文章讨论了写作的重要性和未来写作技能的变化。作者认为,写作是一种思考的方式,能够帮助人们清晰地表达自己的想法和观点。然而,随着 AI 技术的发展,写作技能可能会变得越来越不重要。作者预测,未来将会出现一个"写者"和"非写者"的世界,写者将是那些仍然能够写作的人,而非写者将是那些依赖 AI 写作的人。

HN 评论 141 comments | 作者:baxtr | 14 hours ago

  • • 互联网时代,文本沟通(如短信、社交媒体)变得更为普遍,写作能力的重要性并未减弱。

  • • 新一代(如 Z 世代)更多使用视频和图像进行沟通,可能减少写作能力的使用,未来可能依赖 AI 代写文档。

  • • 当前的视频和图像沟通方式(如 TikTok、Instagram)主要表达情感,而非复杂的思考。

  • • 视频和图像沟通方式可能提高新一代的识字率,因为这些平台嵌入了大量的文本元素。

  • • 写作是清晰思考的重要工具,但并非唯一工具,人们在不写作的情况下也能进行有效的思考。

8. 开源软件是否能成为大型科技公司的替代品?(Open Source on its own is no alternative to Big Tech)

https://berthub.eu/articles/posts/open-source-by-itself-is-no-alternative-for-big-tech/

本文讨论了开源软件是否能成为大型科技公司的替代品。作者认为,开源软件和大型科技公司提供的服务是两种不同的东西。开源软件是一种免费的软件,但需要有人来维护和支持它,而大型科技公司提供的是一个完整的服务,包括软 件、硬件和支持。

HN 评论 183 comments | 作者:lhoff | 16 hours ago

  • • 企业购买软件时更看重的是软件的可靠性、长期性、服务和支持,而不仅仅是软件本身或其价格。

  • • 开源软件的许可证在实际业务中并不重要,供应商通过确保软件的有效性和提供支持来吸引客户。

  • • 红帽(Red Hat)等公司通过提供开源软件的支持和服务来盈利,而不是通过销售软件本身。

  • • 开源软件通常缺乏多个支持供应商,企业难以在不改变主要操作的情况下更换支持供应商。

  • • 云服务提供商的锁定效应可能导致企业未来面临高昂的成本和业务连续性问题。

9. 学校并不是唯一的选择 (School is Not Enough: Learning is a consequence of doing)

https://map.simonsarris.com/p/school-is-not-enough

文章讨论了现代教育系统的弊端,认为学校并不是唯一的选择,尤其是对于那些有才华和好奇心的孩子。作者认为,学校的教育模式往往限制了孩子的发展,导致他们缺乏实践经验和创造力。文章列举了几个历史上的成功故事,例如达·芬奇、沃尔特·迪士尼和安德鲁·卡内基,他们在很小的时候就开始学习和工作,取得了成功。

HN 评论 94 comments | 作者:Gooblebrai | 8 hours ago

  • • 做事是学习的好方法,但不能因此忽视学校的教育

  • • 早期开始工作并不一定能成为成功人士,很多人只是成为普通的劳动者

  • • 文章存在幸存者偏差,忽略了那些没有成功的人

  • • 社会问题更多是由于官僚主义和繁文缛节,而不是学校本身

  • • 美国的监管体系和公共教育系统存在严重问题,影响了人才的发展

10. 介绍 Moonshine,语音识别的新突破 (Introducing Moonshine, the new state of the art for speech to text)

https://petewarden.com/2024/10/21/introducing-moonshine-the-new-state-of-the-art-for-speech-to-text/

Pete Warden 在博客中介绍了 Moonshine,这是一种新的语音识别模型,能够比当前最先进的模型 Whisper 更快、更高效地识别语音。Moonshine 的速度比 Whisper 快 1.7 倍,同时保持或超过 Whisper 的准确率。Moonshine 的发布 为语音识别应用开启了新的可能性,特别是在资源有限的设备上。

HN 评论 154 points | 作者:freediver | 18 hours ago

  • • Moonshine 在长句子上的表现接近 Whisper,但对短句子的处理效果较差

  • • Moonshine 与 Whisper 相比,资源消耗更少,但准确率略低

  • • 80MB 的 Whisper 模型对于某些简短命令如“开灯”可能足够使用

  • • 对于 CPU 个人使用,Whisper 的“base”模型可用,“small”模型效果好但速度慢

  • • Moonshine 模型需要与 faster-whisper 进行比较,因为后者在多个项目中表现更优

完整摘要请点击 “阅读原文” 👇👇👇


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/175417
 
164 次点击