其他
https://www.cherry-ai.com/download
模型
类型 | 厂商 | 模型 |
---|---|---|
LLM | Gemini |
Claude
开源参考
项目 | 说明 |
---|---|
Langchain-chatchat | 可离线部署的 RAG 与 Agent 应用项目 |
torchkeras | |
transformers-stream-generator |
huggingface 国内下载 https://hf-mirror.com/
查看显存 nvidia-smi
watch -n 10 nvidia-smi
vllm
gpu_memory_utilization
pip install -r requirements.txt --use-pep517
本地模型加载
修改 configs/model_config.py
NLP
https://github.com/HqWu-HITCS/Awesome-Chinese-LLM
https://github.com/chatchat-space/Langchain-Chatchat/issues/3003
from os import *
from pwd import *
def get_username():
return getpwuid(getuid())[0]
\Miniconda3\envs\l2\Lib
文本分类
- 情感分类
- 零样本分类
文本生成
完形填空(Fill-Mask)
命名实体识别()
抽取式问答
摘要
翻译
只有编码器的模型:擅长自然语言理解任务,例如文本分类和命名实体识别。
只有解码器的模型:擅长自然语言生成任务,例如文本生成。
编码器和解码器或(序列到序列seq2seq)模型:擅长给定输入条件的文本生成任务,例如翻译和摘要。
编码器架构Encoder ALBERT, BERT, DistilBERT, ELECTRA, RoBERTa 文本分类、命名实体识别和抽取式问答
解码器架构Decoder CTRL, GPT, GPT-2, Transformer XL 文本生成
Seq2seq架构Encoder-decoder BART, T5, Marian, mBART 摘要、翻译和生成式问答
ImportError: libGL.so.1: cannot open shared object file: No such file or directory
pip install opencv-python-headless
digital life server
安装
sudo apt-get install libasound-dev portaudio19-dev libportaudio2 libportaudiocpp0
pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
神经网络自己学习特征,不需要进行特征工程
每层都需要非线性变换
神经元越多越容易过拟合
https://cs.stanford.edu/people/karpathy/convnetjs/demo/classify2d.html
sigmoid 容易梯度消失
Relu 小于0 等于0 大于0 梯度等于本身(常用)
数据标准化
X - np.mean(X, axis=0)
X / np.std(X, axis=0)
参数初始化
W = 0.01 * np.random.randn(D,H)
drop-out
偏差(bias)、方差(variance)
bias: 模型的预测值与实际值之间的偏离关系
variance: 测试集和训练集的误差偏离程度
高偏差, 数据集再大也不会降低误差
拟合直线?曲线或更复杂的函数
监督学习
回归(无限多的可能中输出一个)、分类(只有有限的少量可能的输出)
无监督学习
聚类
cost function
2242243 gpu
64643 cpu