社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

3w+星标项目大佬创业:树莓派即可运行大模型,已获GitHub前CEO投资

CV技术指南 • 1 年前 • 332 次点击  

前言 资深开发大佬,终于忍不住自己出来创业了。

Pytorch训练营,花两个星期彻底掌握代码实现

CV各大方向专栏与各个部署框架最全教程整理

CV全栈指导班、基础入门班、论文指导班 全面上线!!

来源:量子位
仅用于学术分享,若侵权请联系删除

Georgi Gerganov,今年三月曾开源了llama.cpp项目,GitHub上已破三万星标,要知道Stable Diffusion也不过8.8k。

这个项目能让开发者在没有GPU情况下运行Meta的LLaMA模型,即便是在树莓派、MacBook上运行大模型也通通不在话下~

在 M2 Max 上以 40 tok/s 的速度运行 7B LLaMA

甚至还成功吸引了小扎的注意:Meta也在运行llama.cpp

可能由于反响太好,这位大哥决定把背后核心纯C语言框架ggml拿出来创业:原本是几月前的副业项目。

在官宣前这家公司就已经获得来自GitHub前CEONat Friedman、Y Combinator合伙人Daniel Gross的种子前投资。

消息一出,众多开发者赶来祝贺。

其中不乏一些坚定的拥护者:ggml正在将大模型普及到边缘设备。

没过多久就有人建议:苹果应该将它收购了。(狗头)

llama.cpp作者创业

ggml,是一个纯C语言编写的张量库,可帮助开发者在消费级硬件上运行大模型,GitHub星标数达到4.4k。

由于加速效果惊人,一下子收获了不少开发者的支持。

By the way,ggml的gg恰好是他名字的缩写。

大哥自己的两个上万星标的项目llama.cpp和whisper.cpp都使用了它。


后者是为OpenAI的Whisper自动语音识别模型开发的加速方案,可在Mac、Windows、Linux、iOS、安卓、树莓派以及web上运行。

使用whisper.cpp在 树莓派上检测短语音命令

不少初创公司,比如主打生活搜索引擎的rewind都使用了这套解决方案。

还有两个项目同时在终端上运行。

在单个M1Pro上同时运行4个13B LLaMA+Whisper Small实例

根据个人介绍,ggml张量库具有以下这些特点:

支持 16bit 浮点数;支持整数量化(包括 4 位、5 位、8 位);自动微分;内置优化算法(例如 ADAM、L-BFGS);为苹果芯片设置特定优化;在 x86 架构上使用AVX / AVX2 Intrinsic;通过WebAssembly和WASM SIMD提供Web支持;无第三方依赖;运行时零内存分配;支持指导型语言输出……

目前这个库以及相关项目都是免费开源,开发过程也全公开;当然也不排除开发授权给一些商业用途的项目。

用C/C++重写神经网络代码

而这背后的开发大佬Georgi Gerganov也值得说道说道。

他的个人网站十分简单直接,甩出各种开源项目,除此之外别无其他。可以看出,他是C/C++的狂热爱好者,信仰Vim。

此前,他曾用C/C++语言重写神经网络推理代码,这样几乎不依赖于其他库,以此提升效率。至于llama.cpp也是他一晚上Hacking出来的。

除此之外,他还有一些有意思的项目。

比如检查键盘是否可以通过麦克风窃听、猜Hacker News的标题,Wordle克隆版等等。

One More Thing

值得一提的是,背后的这两个投资者也有点意思。

他们还专门给创业者提供算力集群,只需在网站上申请即可。这波是在Next Level上了~

参考链接:
[1]https://ggerganov.com/

[2]http://ggml.ai/
[3]https://twitter.com/ggerganov

若觉得还不错的话,请点个 “赞” 或 “在看” 吧

论文指导班

论文指导班面向那些没有导师指导、需要升学申博的朋友,指导学员从零开始调研相关方向研究、尝试idea、做实验、写论文,指导老师会提供一些idea、代码实现部分的指导、论文写作指导和修改,但整体仍然是由学员自主完成。需要说明的是,论文指导班并非帮你写论文,或者直接给一篇论文让你挂名,我们不会做任何灰色产业,因此,想直接买论文或挂名的朋友请勿联系。

指导老师:

海外QS Top-60某高校人工智能科学博士在读, 师从IEEE Fellow,曾在多家AI企业担任研究实习生和全职算法研究员,具备极强的学术届和工业界综合背景。研究领域主要包括通用计算机视觉模型的高效设计,训练,部署压缩以及在目标检测,语义分割等下游任务应用,具体包括模型压缩 (知识蒸馏,模型搜索量化剪枝), 通用视觉模型与应用(VIT, 目标检测,语义分割), AI基础理论(AutoML, 数据增广,无监督/半监督/长尾/噪声/联邦学习)等;共发表和审稿中的15余篇SCI国际期刊和顶级会议论文,包括NeurIPS,CVPR, ECCV,ICLR,AAAI, ICASSP等CCF-A/B类会议。发明专利授权2项。

长期担任计算机视觉、人工智能、多媒体领域顶级会议CVPR, ECCV, NeurIPS, AAAI,  ACM MM等审稿人。指导研究生本科生发表SCI, EI,CCF-C类会议和毕业论文累计30余篇,有丰富的保研,申博等方面经验,成功辅导学员赴南洋理工,北大,浙大等深造。

涉及范围:CCF会议A类/SCI一区、CCF会议B类/SCI二区、CCF会议C类/SCI三区、SCI四区、EI期刊、EI会议、核心期刊、研究生毕业设计

报名请扫描下方二维码了解详细情况,备注:“论文班报名”。

如果有其他想要当论文指导老师的朋友,请发简历给我,同样扫描上方二维码,备注:“论文指导老师”。基本条件:已发表两篇以上一作顶会,或3-5篇其他级别的一作论文,学历在985博士及以上。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/156810
 
332 次点击