谁的友人A的博客
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

研读 Transformer 论文- ai 时代爆发的前提

深度学习模型的发展RNN:循环神经网络 Encoder,Decoder架构 初始的注意力机制尽管注意力模型的表现已经足够优秀,但所有基于RNN的模型都面临着同样一个问题:RNN本轮的输入状态取决于上一轮的输出状态,这使RNN的计算必须串行执行。因此,RNN的训练通常比较缓慢。在这一背景下,抛弃RNN,只使用注意力机制的Transformer横空出世了。 注意力机制的理解注意力向量化,查询Q为向量,
2026-01-16

推荐系统学习(二):召回-协同过滤-ItemCF

基于物品的协同过滤 (ItemCF)核心思想ItemCF 的核心假设是:用户的兴趣具有连贯性,喜欢某个物品的用户,往往也会对与该物品相似的其他物品感兴趣。例如,一个购买了T恤的用户,很可能也会喜欢与这件T恤相似的夹克。算法的目标是回答“和你喜欢的物品相似的还有什么”。 第一步:物品相似度计算余弦相似度 (Cosine Similarity)当只有用户的交互行为(如点击、购买,即隐式反馈)而没有具
2026-01-15

再探 WebSocket -不止于全双工

如果你像我一样,对 HTTP/1/2/3 的演进和 gRPC 的四种调用模式很了解,但谈起 websocket 时认知止于全双工通信,那么 WebSocket 值得我们用同样的视角,重新审视一番。 参照对比:它与 HTTP 有何不同?和另一个全双工的 gRPC 双向流又有什么区别?1. 对比 HTTP/1, 2, 3将 HTTP 简单地描述为“一问一答”不够
2026-01-08

初见广告系统-常见概念及单次展示全流程

概念pCTR :预估点击率pCVR :预估转化率 1.ecpm : effective Cost Per Mille,有效的千次展示成本预估点击率点击出价pCTR (predicted Click-Through Rate):模型预估的、这个用户看到这个广告后,点击它的概率。这部分的技术和推荐系统的CTR预估模型几乎完全一样,都使用LR、GBDT、DeepFM、WDL等深度学习模型。模型输入的特征
2026-01-08

Elasticsearch入门使用

#ES的部分原理 默认打分规则默认相关性评分 (Relevance Score):默认使用 BM25 算法(可以看作是 TF-IDF 的升级版)。它会综合考虑: 词频 (Term Frequency):关键词在文档中出现的次数。 逆文档频率 (Inverse Document Frequency):关键词在所有文档中的稀有程度。 字段长度 (Field Length):字段越短,匹配到的权重越高
2025-12-15

推荐系统学习(一):召回-协同过滤-UserCF

基于用户的协同过滤(userCF)第一步:用户相似度计算杰卡德相似系数被推荐用户A,另一个用户B,只计算他们共同 item 数 占 A item 数 的比值。公式表现为: 1w_{uv} = \frac{|N(u) \cap N(v)|}{|N(u) \cup N(v)|} 余弦相似度通过向量化表示用户,对两个用户求向量夹角,可以体现出两
2025-12-11

ubuntu创建应用的快捷方式

在ubuntu上我们通过deb包安装的软件可能会没有快捷方式,这个时候就需要我们自己在终端上创建快捷方式了。 主要流程有以下几步,这里我们以go语言的IDE goland为例 1.创建对应的desktop文件比如goland,我们需要在/usr/share/applications目录下创建goland.desktop 12cd /usr/share/applicat
2024-10-21

如何在GNU/Linux下实现自己的shell

TASK打造一个绝无伦比的 xxx-super-shell (xxx 是你的名字),它能实现下面这些功能: 实现 管道 (也就是 |) 实现 输入输出重定向(也就是 < > >>) 要求实现 在管道组合命令的两端实现重定向运算符 1234# Require cat < 1.txt | grep -C 10 abc | grep -L efd | tac &
2024-03-28

搜索

Hexo Fluid
总访问量 次 总访客数 人