博士这五年
李沐大神三部曲之一“博士这五年”
前言
12年8月提着一个行李箱降落在匹兹堡机场。没找住的地方,也不知道CMU应该怎么去。对未来一片迷茫,但充满乐观。 现在,刚完成了博士期间最后的一场报告,在同样的机场,不过是在等待离开的航班。
回想过去的五年,是折腾的五年,也是自我感悟和提升的五年。这里我尝试记录这五年主要做过的事情和其中的感想,希望对大家有所启发。
栖居在城市的大地上,分享城市中的感想予你,在留言板留下你的足迹,希望你在这里有所收获,祝幸运
计算机相关的技术分享
Character.ai是一个由前谷歌LaMDA开发者创建的聊天机器人应用,允许用户与定制的虚拟角色互动,这些角色基于各种人物或原创设计。用户可以设定角色个性并参与多样化的对话,从辅助写作到模拟对话等。该平台支持多种语言,并禁止浪漫或色情主题的对话。
网站地址:character.ai
当你想要真正动手体验一把本地大模型时,却发现需要获取模型权重、克隆项目代码、执行模型量化、设置环境变量、构建可执行文件等诸多环节才能以命令行的形式问一个测试问题,更不要提数十个可能需要手动调整的参数了。
Ollama——一个简明易用的本地大模型运行框架。随着围绕着 Ollama 的生态走向前台,更多用户也可以方便地在自己电脑上玩转大模型了
很长一段时间里,本地大模型和基于 llama.cpp 的应用都局限于少数极客和研究者的圈子,较高的上手门槛将许多普通人拒之门外。Ollama 很好的解决了这个问题!
Ollama地址:ollama.com
根据电脑系统(macOS/Linux/Windows)下载: ollama.com/download
github地址:github.com/ollama/ollama
Champ 三维参数导引下可控一致的人体图像动画生成项目。只需要一张照片,就能让照片里的人物动起来。
项目地址:github.com/fudan-generative-vision/champ
MuseV 基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成项目。
项目地址:github.com/TMElyralab/MuseV
BrushNet 一个具有分解双分支扩散的图像修复模型。对于画面上的 Mask 区域(蒙版,存在缺失的部分),BrushNet 可以对其进行修复。此外,BrushNet 对于任何已经预先训练好的扩散模型都可以实现“即插即用”。
项目地址:github.com/TencentARC/BrushNet
MediaCrawler 这是一款开源的爬虫项目,用于爬取小红书、抖音、快手、B站、微博的视频、图片、评论、点赞、转发等信息。
项目地址:github.com/NanmiCoder/MediaCrawler
prompt.newzone.top
IMGPrompt,极简的图像提示词编辑器,专注于提示词文本组合,可用于Stable Diffusion和Midjourney。