WhosefriendA's Blog

研读 Transformer 论文- ai 时代爆发的前提

深度学习模型的发展RNN：循环神经网络 Encoder,Decoder架构初始的注意力机制尽管注意力模型的表现已经足够优秀，但所有基于RNN的模型都面临着同样一个问题：RNN本轮的输入状态取决于上一轮的输出状态，这使RNN的计算必须串行执行。因此，RNN的训练通常比较缓慢。在这一背景下，抛弃RNN，只使用注意力机制的Transformer横空出世了。注意力机制的理解注意力向量化，查询Q为向量，

2026-01-16

推荐系统学习(二)：召回-协同过滤-ItemCF

基于物品的协同过滤 (ItemCF)核心思想ItemCF 的核心假设是：用户的兴趣具有连贯性，喜欢某个物品的用户，往往也会对与该物品相似的其他物品感兴趣。例如，一个购买了T恤的用户，很可能也会喜欢与这件T恤相似的夹克。算法的目标是回答“和你喜欢的物品相似的还有什么”。第一步：物品相似度计算余弦相似度 (Cosine Similarity)当只有用户的交互行为（如点击、购买，即隐式反馈）而没有具

2026-01-15

再探 WebSocket -不止于全双工

如果你像我一样，对 HTTP/1/2/3 的演进和 gRPC 的四种调用模式很了解，但谈起 websocket 时认知止于全双工通信，那么 WebSocket 值得我们用同样的视角，重新审视一番。参照对比：它与 HTTP 有何不同？和另一个全双工的 gRPC 双向流又有什么区别？1. 对比 HTTP/1, 2, 3将 HTTP 简单地描述为“一问一答”不够

2026-01-08

初见广告系统-常见概念及单次展示全流程

概念pCTR :预估点击率pCVR :预估转化率 1.ecpm : effective Cost Per Mille，有效的千次展示成本预估点击率点击出价pCTR (predicted Click-Through Rate)：模型预估的、这个用户看到这个广告后，点击它的概率。这部分的技术和推荐系统的CTR预估模型几乎完全一样，都使用LR、GBDT、DeepFM、WDL等深度学习模型。模型输入的特征

2026-01-08

Elasticsearch入门使用

#ES的部分原理默认打分规则默认相关性评分 (Relevance Score)：默认使用 BM25 算法（可以看作是 TF-IDF 的升级版）。它会综合考虑：词频 (Term Frequency)：关键词在文档中出现的次数。逆文档频率 (Inverse Document Frequency)：关键词在所有文档中的稀有程度。字段长度 (Field Length)：字段越短，匹配到的权重越高

2025-12-15

推荐系统学习(一)：召回-协同过滤-UserCF

基于用户的协同过滤(userCF)第一步：用户相似度计算杰卡德相似系数被推荐用户A，另一个用户B，只计算他们共同 item 数占 A item 数的比值。公式表现为： 1w_{uv} = \frac{|N(u) \cap N(v)|}{|N(u) \cup N(v)|} 余弦相似度通过向量化表示用户，对两个用户求向量夹角，可以体现出两

2025-12-11

ubuntu创建应用的快捷方式

在ubuntu上我们通过deb包安装的软件可能会没有快捷方式，这个时候就需要我们自己在终端上创建快捷方式了。主要流程有以下几步，这里我们以go语言的IDE goland为例 1.创建对应的desktop文件比如goland，我们需要在/usr/share/applications目录下创建goland.desktop 12cd /usr/share/applicat

2024-10-21

如何在GNU/Linux下实现自己的shell

TASK打造一个绝无伦比的 xxx-super-shell (xxx 是你的名字)，它能实现下面这些功能：实现管道 (也就是 |) 实现输入输出重定向(也就是 < > >>) 要求实现在管道组合命令的两端实现重定向运算符 1234# Require cat < 1.txt | grep -C 10 abc | grep -L efd | tac &

2024-03-28