社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
DeepSeek回应闪崩:可能与新模型发布后的访问量激增有关;马斯克考虑应用区块链技术来提高美国政府...
超越ChatGPT,DeepSeek在美国“登顶”!创始人将回广东过年
超越ChatGPT登顶!大量网友涌入,中国“神秘力量”震动美国科技圈,由杭州公司开发
国产AI DeepSeek下载排行第一,AI界拼多多要逆袭chatgpt
图灵奖得主,深度学习三巨头对 #DeepSeek# 的评价:开源-20250126193558
碾压ChatGPT !让硅谷华尔街一夜破大防,这个浙大天才揭开了教育的核心……
DeepSeek超越ChatGPT,登顶美区第一!黑神话老板狂推
超越ChatGPT登顶!来自杭州的DeepSeek火了,相关概念股集体大涨
国产大模型超越了ChatGPT?!记者实测做奥数题写作文
中国AI刷屏外媒,DeepSeek下载热度仅次于ChatGPT!
关注
Py学习
»
机器学习算法
网传字节跳动实习生删除GB以下所有机器学习模型,差点没上头条......
大数据文摘
• 3 年前 • 388 次点击
大数据文摘授权转载自AI科技评论
作者:陈大鑫、陈彩娴
昨晚脉脉上有网友爆料,字节跳动一位实习生删除了公司所有轻量级别的机器学习模型
!
什么是lite模型?该楼主表示,lite模型就是公司内几乎所有GB大小以下的机器学习模型,且全部被删除了,实习生直接删除的是父目录且加了 skip trash (删除文件时临时禁用回收)操作,导致被删除模型无法被恢复。
当晚全公司通报,直接被列入 P0 事故等级(严重事故):
据楼层讨论,光是处理问题的群就进了接近三百人,其殃及业务之广可想而知:
大家都在讨论这位实习生的去留,我们搜了一下,据说,“只要不是主观故意的”就不会被开除:
所以说一定要稳住别慌,问题不大。
网友热议
有网友表示这是实习生给你们这帮人出了一道hard题,不过没有标准答案,考验你们解题能力的时候到了。
还有网友表示实习生不能有权限操作这么重要的东西,这锅80%应该判给管理者,实习生反倒是暴露了问题,换个角度来看,实习生立功了。
我们知道,字节跳动最出名的文化之一,就是扁平化管理。实习生与正式员工有同样的文档权限,这也是字节能够在与BAT等大厂竞争中保持灵活高效的秘诀,从这个角度上来说,说实习生立功倒也不能算错。
而别的对手就权限不一了。
到底删除了多少模型?根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch模型的备份”,且显示为「被误删」。
又有字节的工程师网友表示删除的都是离线数据,影响不大。该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。
2018年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为45分钟,相关费用和清理成本达到1000万美元,真可谓小手一抖,千万元没有。
字节 AI
字节都有什么出名的机器学习产品?
字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返3岁的AI特效等等。
据 AI科技评论 所知,字节还开源过一个名为LightSeq的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。
据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。
LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。相比于目前其他开源序列推理引擎,LightSeq具有如下几点优势:1. 高性能;2. 支持模型功能多; 3. 简单易用,无缝衔接Tensorflow、PyTorch等深度学习框架。据 AI科技评论 所知,字节跳动AI Lab最近计划要开源「新版训练加速引擎」,可以让模型训练加速3倍以上。
最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB以下的模型真的不算大,算不上是决定性的模型。或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。
点「在看」的人都变好看了哦!
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/116140
388 次点击
登录后回复