本文分类:news发布日期:2024/11/29 16:22:58
相关文章
【深度学习】大模型GLM-4-9B Chat ,微调与部署(3) TensorRT-LLM、TensorRT量化加速、Triton部署
文章目录 获取TensorRT-LLM代码:构建docker镜像并安装TensorRT-LLM:运行docker镜像:安装依赖魔改下部分package代码:量化:构建图:全局参数插件配置常用配置参数 测试推理是否可以代码推理CLI推理 性能测试小…
建站知识
2024/11/19 4:13:05
Redis-高级实战案例
文章目录 Redis集群崩溃时如何保证秒杀系统高可用1. 冗余与备份2. 故障检测与自动切换3. 降级策略4. 数据一致性5. 客户端缓存6. 异常处理与通知7. 测试与演练8. 服务降级与回滚Redis主从切换导致库存同步异常以及超卖问题主从切换导致的库存同步异常原因:解决方案:秒杀链路中…
建站知识
2024/11/30 9:39:06
css: 让下方元素遮住上方元素底部的 box-shadow
背景:
表格底部有 shadow , UI 让去掉, 给了项目中其他正常表格示例
定位:
对比代码发现, 其他表格底部的分页 div 遮住了表格底部的 shadow , 对比两处代码, 找出分页 div 样式不同之处, 遮住 shadow 的分页 div 使用了 position: relative
解决:
给下方元素加上 positio…
建站知识
2024/11/30 9:33:20
FastAPI集成mongodb事务处理
FastAPI 本身并不直接支持数据库事务。事务处理通常由数据库客户端或数据库驱动程序处理。对于 MongoDB 和 FastAPI,你可以使用 motor 库(MongoDB 的异步 Python 驱动程序)来实现事务。
以下是使用 motor 在 FastAPI 中执行 MongoDB 事务的步…
建站知识
2024/11/2 6:07:12
AI学习记录 - 本地知识库实现的相关知识
在公司内部实现了个知识库,但这里只介绍在实现知识库的过程中用到的知识。
1、分词器
先分词,中文可以使用jieba分词
2、构造数据集
将词汇向量化是自然语言处理中的重要任务,它可以将文本数据转化为计算机能够理解和处理的向量形式。以…
建站知识
2024/11/24 19:48:58
Nacos适配达梦数据库并制作镜像
背景:因项目需要信创,需将原本的mysql数据库,改成达梦数据库
一、部署达梦数据库
1.1 部署达梦数据库服务
可参考:Docker安装达梦数据库_达梦数据库docker镜像-CSDN博客
1.2 创建nacos数据库 create user SAFE_NACOS identifi…
建站知识
2024/11/2 5:53:52
Python 消费Kafka手动提交 批量存入Elasticsearch
一、第三方包选择
pip install kafka,对比了kafka和pykafka,还是选择kafka,消费速度更快pip install elasticsearch7.12.0(ES版本)
二、创建es连接对象
from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulkc…
建站知识
2024/11/2 7:13:02