栖居在城市的大地上,分享城市中的感想予你,在留言板留下你的足迹,希望你在这里有所收获,祝幸运

计算机



今天看到一篇文章,用微信聊天记录和 280 篇博客文章,做了我自己的数字克隆AI,这个AI还知道自己是一个模型,还会骂人!!!

文章作者的数字克隆在线聊天:https://ai.greatdk.com

使用和参考的项目:


WechatExporter:BlueMatthew/WechatExporter: Wechat Chat History Exporter 微信聊天记录导出备份程序 (github.com)

chatglm-6b:THUDM/ChatGLM-6B: ChatGLM-6B:开源双语对话语言模型 | An Open Bilingual Dialogue Language Model (github.com)

zero_nlp:yuanzhoulvpi2017/zero_nlp: 中文nlp应用(大模型、数据、模型、训练、推理) (github.com)

chatglm_finetuning:https://github.com/ssbuild/chatglm_finetuning 

MoeChat:Fzoss/MoeChat: 一个比较好看的WEB聊天界面UI (github.com)

Alpaca: A Strong, Replicable Instruction-Following Model:Stanford CRFM

LLAMA:facebookresearch/llama: Inference code for LLaMA models (github.com)

clueai使用教程:

github地址:

Loading...

使用教程:https://www.clueai.cn/doc
使用地址:colab.research.google.com/drive

Colaboratory(简称 Colab),您可在浏览器中编写和执行 Python 代码,并且:无需任何配置,免费使用 GPU,轻松共享。 无论您是一名学生、数据科学家还是 AI 研究员,Colab 都能够帮助您更轻松地完成工作

安装
可以使用 pip命令安装:


pip install --upgrade clueai

也可以通过源码:


python setup.py install

生成参数说明


max_length: 指定生成的文本的token总数量(包括输入的token数量)
min_lenght: 指定生成的文本的最小数量(不包括输入的token数量)
do_sample: 是否采样输出
num_beams: 当使用beam search搜索时需要指定的beam的num,越大效果越好,但是越费时间
temperature: 平滑输出token的概率
top_k: 保留概率最大的前k个进行采样
top_p: 按照概率排序的token,在保留概率累计和为当前值范围内的token进行采样
repetition_penalty: 重复惩罚参数
length_penalty: 长度惩罚参数
no_repeat_ngram_size: 不重复的ngram窗口大小 更多参数和说明参考transformers
ChatYuan功能对话

单轮对话


import clueai
# initialize the Clueai Client with an API Key
cl = clueai.Client('YOUR_API_KEY', check_api_key=True)
prompt= '''用户:介绍一下亚马逊云的历史
小元:'''
# generate a prediction for a prompt 
# 需要返回得分的话,指定return_likelihoods="GENERATION"
prediction = cl.generate(
            model_name='ChatYuan-large',
            prompt=prompt)
            
# print the predicted text          
print('prediction: {}'.format(prediction.generations[0].text))

多轮对话


import clueai
# initialize the Clueai Client with an API Key
cl = clueai.Client('YOUR_API_KEY', check_api_key=True)
prompt= '''用户:新冠什么症状?
小元:新冠是指新型冠状病毒,其症状包括发热、干咳、乏力、嗅味觉减退、呼吸困难等。
用户:可以吃什么药?
小元:根据您提供的病史,目前没有明确的抗新冠病毒的药物,建议您在家进行自我隔离,避免与他人接触,多喝开水,清淡易消化饮食,避免熬夜和过度劳累,适当进行户外活动。
用户:帮我写一个2023年工作规划
小元:'''
# generate a prediction for a prompt 
# 需要返回得分的话,指定return_likelihoods="GENERATION"
prediction = cl.generate(
            model_name='ChatYuan-large',
            prompt=prompt)
            
# print the predicted text          
print('prediction: {}'.format(prediction.generations[0].text))

经过几年的时间逐渐认识到博客的重心是内容,这里由Wordpress转Typecho重新搭建。

  1. 先在各大服务器商选择云服务器,在活动期间新客户可以在百元之内选购自己的服务器。
  2. 接下来在服务器中选取相应的的镜像搭建博客,可以选择Typecho相对应的镜像也可选择各大系统来自己部署Typecho,自己所选取的为Typecho镜像。
  3. 在搭建过程中遇到的相关问题有域名的配置以及SSL证书的申请,有一次在使用旧的备份镜像的时候通过IP无法进行访问,后来一查原来是Nginx没有启动,自己尽然用了半天的时间来找问题出在哪里,寻找bug的路程总是那么漫长。