栖居在城市的大地上,分享城市中的感想予你,在留言板留下你的足迹,希望你在这里有所收获,祝幸运

今天看到一篇文章,用微信聊天记录和 280 篇博客文章,做了我自己的数字克隆AI,这个AI还知道自己是一个模型,还会骂人!!!

文章作者的数字克隆在线聊天:https://ai.greatdk.com

使用和参考的项目:

WechatExporter:BlueMatthew/WechatExporter: Wechat Chat History Exporter 微信聊天记录导出备份程序 (github.com)

chatglm-6b:THUDM/ChatGLM-6B: ChatGLM-6B:开源双语对话语言模型 | An Open Bilingual Dialogue Language Model (github.com)

zero_nlp:yuanzhoulvpi2017/zero_nlp: 中文nlp应用(大模型、数据、模型、训练、推理) (github.com)

chatglm_finetuning:https://github.com/ssbuild/chatglm_finetuning 

MoeChat:Fzoss/MoeChat: 一个比较好看的WEB聊天界面UI (github.com)

Alpaca: A Strong, Replicable Instruction-Following Model:Stanford CRFM

LLAMA:facebookresearch/llama: Inference code for LLaMA models (github.com)

clueai使用教程:

github地址:https://github.com/clue-ai/ChatYuan
使用教程:https://www.clueai.cn/doc
使用地址:colab.research.google.com/drive

Colaboratory(简称 Colab),您可在浏览器中编写和执行 Python 代码,并且:无需任何配置,免费使用 GPU,轻松共享。 无论您是一名学生、数据科学家还是 AI 研究员,Colab 都能够帮助您更轻松地完成工作

安装
可以使用 pip命令安装:

pip install --upgrade clueai

也可以通过源码:

python setup.py install

生成参数说明

max_length: 指定生成的文本的token总数量(包括输入的token数量)
min_lenght: 指定生成的文本的最小数量(不包括输入的token数量)
do_sample: 是否采样输出
num_beams: 当使用beam search搜索时需要指定的beam的num,越大效果越好,但是越费时间
temperature: 平滑输出token的概率
top_k: 保留概率最大的前k个进行采样
top_p: 按照概率排序的token,在保留概率累计和为当前值范围内的token进行采样
repetition_penalty: 重复惩罚参数
length_penalty: 长度惩罚参数
no_repeat_ngram_size: 不重复的ngram窗口大小 更多参数和说明参考transformers
ChatYuan功能对话

单轮对话

import clueai
# initialize the Clueai Client with an API Key
cl = clueai.Client('YOUR_API_KEY', check_api_key=True)
prompt= '''用户:介绍一下亚马逊云的历史
小元:'''
# generate a prediction for a prompt 
# 需要返回得分的话,指定return_likelihoods="GENERATION"
prediction = cl.generate(
            model_name='ChatYuan-large',
            prompt=prompt)
            
# print the predicted text          
print('prediction: {}'.format(prediction.generations[0].text))

多轮对话

import clueai
# initialize the Clueai Client with an API Key
cl = clueai.Client('YOUR_API_KEY', check_api_key=True)
prompt= '''用户:新冠什么症状?
小元:新冠是指新型冠状病毒,其症状包括发热、干咳、乏力、嗅味觉减退、呼吸困难等。
用户:可以吃什么药?
小元:根据您提供的病史,目前没有明确的抗新冠病毒的药物,建议您在家进行自我隔离,避免与他人接触,多喝开水,清淡易消化饮食,避免熬夜和过度劳累,适当进行户外活动。
用户:帮我写一个2023年工作规划
小元:'''
# generate a prediction for a prompt 
# 需要返回得分的话,指定return_likelihoods="GENERATION"
prediction = cl.generate(
            model_name='ChatYuan-large',
            prompt=prompt)
            
# print the predicted text          
print('prediction: {}'.format(prediction.generations[0].text))

很难抉择,我没有那么多的精力,有这些事情,又有很多其它的事情,或许都想做,需要一个轻重缓急,先做哪一个,或许是不想失去什么,不想丢失什么,但人生怎么会是完美的,怎么会没有抉择,在想自己想要的是什么?小时候是知道的,或许长大了,所见的事物越来越多,欲求也越来越多,这样一切都在改变着,自己也在改变着,慢慢不知道自己想要什么了。