95后女生创立的AI视频生成工具PikaLabs在上周刷屏,4人团队,成立半年就获得5500万美元融资,估值2亿美元。同时也在A股上演了“父凭女贵”的戏码,其父亲所在的上市公司在这款工具爆火后连续收获3个涨停。国内首套完全用AIGC设计的汉服成衣亮相第十七届杭州文博会,AIGC在影视行业有了用武之地。导演借助无界AI,可以很直观地生成自己想要的东西,给到需要沟通的部门,大大节省了沟通成本。
融资
生成式AI初创公司TogetherAI获超1亿美元A轮融资
据AIGC开放社区报道,11月30日,开源生成式AI平台TogetherAI在官网宣布,获得1.025亿美元(约7.3亿元)A轮融资。本次由凯鹏华盈(KleinerPerkins)领投,英伟达、EmergenceCapital、NEA、Prosperity7、Greycroft等跟投。
生成式AI初创公司PikaLabs完成5500万美元融资,并推出视频生成器Pika1.0
据报道,11月29日,生成式AI初创公司PikaLabs在由NatFriedman和DanielGross领投的前种子轮和种子轮融资以及由LightspeedVenturePartners领投的A轮融资中筹集了5500万美元。其他投资者包括AdamD'Angelo(Quora创始人兼首席执行官)、AndrejKarpathy、ClemDelangue(HuggingFace联合创始人兼首席执行官以及FactorialCapital合伙人)和CraigKallman(AtlanticRecords首席执行官)。
此外,PikaLabs宣布推出视频生成器Pika1.0。据悉,Pika1.0采用了全新的人工智能模型,可以生成和编辑三维动画、动漫、卡通和电影等不同风格的视频。
AI生成工具HeyGen完成560万美元融资
AI新智界讯,11月29日,AI生成工具HeyGen在社交平台X上宣布,获得560万美元的新风险投资,由SarahGuo的ConvictionPartners领投。该公司本轮融资估值为7500万美元。此外,HeyGen表示,其ARR(年度经常性收入)已在一年内从100万美元增长到1800万美元,并推出InstantAvatar(Avatar2.0)。
生物技术和AI初创公司Cradle获2400万美元A轮融资
据报道,11月28日,继去年完成550万美元的种子轮融资后,生物技术和人工智能初创公司Cradle获得2400万美元A轮融资,此前投资者IndexVentures领投,KindredCapital(也是种子轮投资者)以及ChrisGibson、TomGlocer等个人投资者参投,新资金将用于发展团队和销售。
“海纳AI”完成数千万元A轮融资,联想创投独家投资
据36氪12月1日报道,“海纳AI”近日完成数千万元A轮融资,由联想创投独家投资,本轮融资资金将用于人才招募、AI模型研发、营销体系搭建。据了解,“海纳AI”是北京群星闪耀科技有限公司旗下的人才招聘垂直领域AI产品,最早于2019年推出,专攻AI面试服务,帮助企业借助AI技术完成招聘面试环节。
大模型
哈尔滨工业大学(深圳)发布多模态大模型“九天”
据站长之家12月4日报道,哈尔滨工业大学(深圳)近期发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在13个视觉语言任务上的state-of-the-art性能,尤其在VisualSpatialReasoning任务上实现了5%的性能提升。
智源研究院正式开源700亿参数大模型Aquila2-70B-Expr
据36氪11月30日报道,北京智源人工智能研究院副院长兼总工程师林咏华在2023人工智能计算大会上宣布,正式开源700亿参数大模型Aquila2-70B-Expr(异构先驱版),这是首个基于英伟达混合资源及天数智芯混合资源完成训练的大模型。
据介绍,此次基于FlagScalev0.2分别在英伟达混合资源(A100集群+A800集群)、天数智芯混合资源(BI-V100集群+BI-V150集群)完成了Aquila2-70B-Expr大模型训练工作。
浪潮信息发布千亿级开源大模型“源2.0”
据钛媒体11月27日报道,浪潮信息正式发布千亿级开源大模型“源2.0”。源2.0采用LFA(LocalizedFiltering-basedAttention)局部依赖的自注意力机制,可有效捕捉局部信息和短序列信息,使得模型能够更精准地掌握上下文之间的强语义关联,学习人类语言习惯范式和编程能力。
复旦保险团队发布“保险智酷”保险领域专用大模型
据《科创板日报》12月2日报道,复旦保险红人节暨“保险智酷”大模型发布会召开,由复旦保险团队研发的保险垂直大模型“保险智酷”在会上发布。据介绍,“保险智酷”是为保险场景下的各类用户提供专业、智能、全面的数字化服务的保险领域专用大语言模型。
阿里云开源通义千问720亿参数模型
据金十12月1日消息,阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio。据悉,阿里云本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向72B、1.8B对话模型提供了4bit/8bit量化版模型,便于开发者们推理训练。
腾讯、南洋理工等开源图表羊驼大模型ChartLlama
幻方量化旗下DeepSeek发布67B大模型
AI新智界讯,11月29日,知名私募巨头幻方量化官方宣布,其探索AGI(通用人工智能)的新组织“深度求索(DeepSeek)”继11月初发布Coder代码模型之后,正式发布通用大语言模型“DeepSeekLLM67B”。模型已完全开源,同时服务已经全面开放内测。
DeepSeek称,相比开源的同级别模型LLaMA270B,DeepSeekLLM67B在近20个中英文的公开评测榜单上表现更佳,尤其突出的是推理、数学、编程等能力。
StabilityAI推出StableDiffusionXLTurbo模型
据IT之家11月30日报道,StabilityAI日前推出了StableDiffusionXLTurbo(SDXLTurbo),为此前SDXL模型的改进版本,号称采用了“对抗性扩散蒸馏技术(AdversarialDiffusionDistillation)”,将图片生成迭代步骤从原先的50步减少至1步,据称“仅仅进行一次迭代步骤就能生成高品质图像”。
据悉,StableDiffusionXLTurbo模型的最大特点,就是上述“一次迭代生成图像”,号称可以进行“即时文字转图像输出”,并能够保证图片的质量。实验结果显示,StableDiffusionXLTurbo在大幅降低运算需求的同时,仍可以保持良好的图像生成品质,该模型单词迭代,即胜过4次迭代的LCM-XL,而4次迭代的StableDiffusionXLTurbo就可击败此前经过50步迭代配置的StableDiffusionXL;在A100GPU上,计算512x512分辨率的图像,只需207毫秒。
谷歌发布Translatotron3模型,可绕过文本转换步骤
据IT之家消息,谷歌正式介绍推出了名为Translatotron3的新AI模型,无需任何并行语音数据下,可以实现语音对语音的同声传译翻译。
谷歌于2019年推出了TranslatotronS2ST系统,于2021年7月推出第2个版本,在2023年5月27日发布的一篇论文中,宣布正在部署新方法,训练Translatotron3。研究人员称,Translatotron2已经提供了卓越的翻译质量、语音鲁棒性(Robust)和语音自然度,而Translatotron3实现“第一个完全无监督直接语音到语音翻译的端对端模型”。
应用
亚马逊推出多项AI工具,包括Titan系列AI模型等
据VentureBeat11月30日报道,继推出名为AmazonQ的新型聊天机器人,升级款AI系统处理器Trainium2,并与英伟达拓展伙伴关系外,亚马逊AWS数据与人工智能副总裁SwamiSivasubramanian昨日在re:Invent大会上又公布了一系列新的AI工具。其中包括三款“Titan”系列生成式AI模型:TitanImageGenerator、TitanTextExpress和TitanTextLite。此外,AmazonBedrock也迎来升级,可为企业客户提供了对市面上大多数模型的访问权限,包括AI21的Jurassic、Anthropic的Claude2.1、Meta的Llama2和StableDiffusion。
国内首套完全用AIGC设计的汉服成衣亮相第十七届杭州文博会
AI新智界讯,11月23日至27日,第十七届杭州文化创意产业博览会在杭州成功举办。在此期间,国内首套完全用AIGC设计创作的汉服成衣在展会上亮相。这件汉服的设计源自2023年“梦溪杯”宋韵文化创新大赛的优秀作品《饰韵西子》,由参赛者李超使用无界AI创作完成。该作品的灵感来自四种中国传统配色——鞠衣、杨妃、青莲、翠微,并由无界AI和宋韵汉服大模型搭配工笔人物、勾线水彩等LORA创作而成。
字节跳动在海外上线大模型产品“ChitChop”
据Tech星球11月29日报道,字节在海外上线了一款名为“ChitChop”的大模型产品,开发运营公司是POLIGON,字节旗下海外社交产品Helo同样由该公司运营,目前已上线独立App和网页版。
据悉,ChitChop是一个人工智能助理工具,可以为用户提供多达200+的智能机器人服务,通过提供创造性灵感、提高工作效率等方式来服务用户的工作和生活。值得注意的是,这款产品与抖音集团旗下AI产品“小悟空”类似,都是基于云雀大语言模型创建的AI工具合集。
魅族发布大模型AicyAI,支持问答、绘画等多项AI功能
据快科技11月30日报道,魅族今日官宣发布Flyme10.5系统和自家大模型AicyAI。据介绍,AicyAI是即问即答的百科全书,拥有海量知识的Aicy能回答自然科学、生活知识、健康常识、情感问答等各类问题。另外,Aicy还支持创意灵感生成画作,可以生成写实风、二次元、水墨风等各种风格的画作。此外,图库还新增了AI写真功能。用户上传照片后,AI就能生成其写真照片。
谷歌DeepMind利用AI工具GNoME发现220万种新晶体材料
阿里国际发布3款AI设计生态工具
据《科创板日报》12月1日报道,在第六届中国国际工业设计博览会上,阿里国际发布了3款设计生态工具:堆友、PicCopilot、鹿班AI。据介绍,这3款产品具有AI绘画、AI模型创作、AI图像和视频处理等功能,目前已经服务数十万商家、覆盖50万设计师。
Freepik推出Pikaso实时AI绘图工具采用LCM绘图技术,简单线条即可成图
韩媒:三星GalaxyBook4系列笔记本12月15日发布,将支持本地运行高斯AI大模型
据IT之家援引韩联社报道,有业内人士透露称,三星电子将于本月15日推出搭载英特尔下一代处理器酷睿Ultra的GalaxyBook4系列笔记本电脑,号称是全球首款AI笔记本。
报道称,GalaxyBook4相比上一代产品要提早一个半月亮相。这次之所以选择更早发布,是因为三星需要体现这款新品作为“首款AI笔记本”的象征意义。GalaxyBook4有望搭载其自研的AI大模型“高斯”(SamsungGauss),设备无需将收集到的信息传输到中央服务器,这意味着该笔记本内置的“高斯”将支持本地运行。
华硕将发布首款英特尔酷睿Ultra处理器AI笔记本
AI新智界讯,ASUS华硕今日在微博上宣布,2024华硕酷睿UltraAIPC轻薄本新品发布会将在12月15日15:00举行,届时华硕灵耀系列笔记本新品也将登场。华硕称,这是首台最新酷睿Ultra笔记本电脑。
观点
比尔盖茨:生成式AI已达极限,下一个突破是可解释AI
据《科创板日报》11月27日报道,比尔盖茨表示,OpenAI内部包括奥特曼在内的很多人都相信GPT-5将明显优于GPT-4。但他认为,有很多理由相信,当前生成式人工智能已经达到极限。下一个突破盖茨认为是可解释AI,但预计要到下一个十年(2030-2039)才能实现。
中国科学院院士徐宗本:大模型研究目前与科学化相去甚远
据界面新闻报道,中国科学院院士徐宗本在CCF中国软件大会上表示,大模型作为人工智能发展新浪潮的趋势,对于科研范式、生产方式、工业模式的革命性影响不可低估,投入大模型研究已是必然选择。但他同时表示,大模型研究目前仍属于工程化,与科学化相去甚远。
他认为,软件将成为人工智能最先突破的领域,“软件有语言,语言有语法,语法有严格的标准,人工智能只要能够规范化、有逻辑边界,就能在软件领域做得好。”
HuggingFace联创发布2024年预测:开源LLM将达到最好的闭源LLM水平
北京智源人工智能研究院林咏华:国内AI芯片的大模型训练性能与国外约有三年差距
据《科创板日报》11月29日报道,北京智源人工智能研究院副院长、总工程师林咏华表示,当前中国AI芯片的大模型集群训练性能,只有个别接近英伟达A100/A800,大多数不到50%。此外是生态差距巨大,我国AI芯片公司有40余家,但中国AI芯片整体的市场占有率加起来不超过10%,各家AI芯片软件各异、生态十分零碎割裂。
马云:AI电商时代刚刚开始,对谁都是机会、也是挑战
据《科创板日报》11月29日报道,从多名阿里内部人士处了解到,针对员工对于昨晚拼多多财报和电商等的讨论,马云在阿里内网罕见地参与了谈论并发言。马云称,请大家多提建设性意见和建议,特别是创新想法。他相信今天的阿里人大家都在看都在听,更坚信阿里会变,阿里会改。所有伟大的公司都诞生在冬天里。AI电商时代刚刚开始,对谁都是机会,也是挑战。马云还说,要祝贺拼多多过去几年的决策,执行和努力。“谁都牛过,但能为了明天后天牛而改革的人,并且愿意付出任何代价和牺牲的组织才令人尊重。回到我们的使命和愿景,阿里人,加油!”
Meta首席科学家杨立昆驳黄仁勋:超智能不会很快到来
据IT之家12月4日报道,英伟达首席执行官黄仁勋不久前宣称,超级人工智能(AI)将在五年内赶超人类。对此,Facebook母公司Meta首席科学家、深度学习先驱杨立昆(YannLeCun)的观点截然相反。他认为,超智能不会很快到来。
研报
研究:GPT-4在医学问题上击败了专业调优的MedPaLM2模型
据站长之家12月4日报道,微软研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。
研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径。Medprompt方法采用了多种提示工程技术,包括GPT-4生成的思维链推理和生成多个单独评分的回答,然后将最高分的答案返回给用户。尽管这种方法会增加推理的成本,因为生成了更多的标记,但结果表明,将领先的通用模型(如GPT-4)与高级提示工程技术相结合,以评估最新性能的标准,可能是值得考虑的。
研究称:生成一张AI图像所消耗能源相当于给手机充满电
据站长之家12月1日消息,根据AI初创公司HuggingFace和卡内基梅隆大学的研究人员进行的一项新研究,每次使用AI生成图像、撰写电子邮件或向聊天机器人提问,都会对地球造成一定的负担。
实际上,使用强大的AI模型生成一张图像所消耗的能源相当于给手机充满电,该研究首次计算了使用AI模型进行不同任务所产生的碳排放。然而,他们发现使用AI模型生成文本的能源消耗明显较低。生成1,000次文本只消耗相当于手机充电量的16%的能源。