GraphEmbedding实战系列：Node2vec原理与代码实战-Linux老运维

graphembedding实战系列：node2vec原理与代码实战

论文：《node2vec: Scalable Feature Learning for Networks》

基本介绍：node2vec是一种半监督算法，用于网络中的可扩展特征学习。它通过SGD优化一个定制的基于图的目标函数。这种方法返回特征表示，针对d维空间中的节点，最大化其网络邻节点的似然。

node2vec的关键贡献在于为顶点的网络邻节点定义了一个灵活的概念。通过选择合适的概念，node2vec可以学习到基于网络角色或社群的网络表示。论文通过开发一种有偏的随机游走族谱，有效探索给定顶点的邻居分布。结果算法非常灵活，提供可调参数来控制搜索空间，而不是进行严格搜索。因此，论文的方法可以建模网络等价物。这些参数管理着搜索策略，具有直观解释，使walk偏向不同的网络搜索策略。在半监督学习中，这些参数仅使用少量带标注数据即可直接学习。

我们也展示了如何将单个节点的特征表示扩展到节点对（比如：边）。为了生成边的特征表示，我们将学到的特征表示与简单的二元操作相结合。这种组合性将node2vec引入到关于节点（或边）的预测任务上。

该论文的主要贡献包括：

提出node2vec，一种高效的网络特征学习扩展算法，通过显著的network-aware，neighborhood preserving objectives，使用SGD方法进行高效优化。
展示node2vec如何适应网络科学中已确立的准则，提供在发现表示上的灵活性，并具有不同的等价物。
基于neighborhood preserving objectives，扩展node2vec以及其他特征学习方法，将节点扩展到节点对，以基于边的预测任务。
在多个真实数据集上，评估node2vec在多标签分类和链接预测上的表现。

特征学习框架为了使最优化可处理，论文做出了两个标准假设：

条件独立性。我们通过假设：给定源节点的特征表示，观察到一个邻节点的似然，与观察到其他邻节点是独立的：特征空间的对称性。一个源节点和它的邻节点在特征空间中具有对称性的相互影响。因此，我们建模每个（源节点-邻节点）对的条件似然为一个softmax单元，由它们的特征点积参数化：有了以上假设，等式一的目标可以简化为：

每个节点的分区函数：

，对于大网络来说计算开销很大，可以使用负采样来进行近似。

基于skip-gram的特征学习方法，最早源自于NLP上下文学习。文本本身是线性的，一个邻词可以很自然地使用一个在连续词汇上的滑动窗口进行定义。而对于网络，是非线性的，因此需要更丰富。为了解决这一点，论文提出了一种随机过程，它会对给定源节点u抽样许多不同的邻节点。

不局限于它的立即邻节点，具体取决于抽样策略S，有不同的结构。

经典搜索策略BFS和DFS表示了根据搜索空间进行探索的两种极限情况。

特别的，在网络上的节点的预测任务通常会是两种类型相似度的混合：同质等价和结构等价。在同质假设下，节点高度交错连接，并且属于同网络聚类或社群，在embedding上更紧密（例如：图中的节点

和u属于相同的网络社群）。相反的，结构等价假设下，在网络上具有相似结构角色的节点，应该在embedding上更紧密（例如：节点u和

在图上扮演着相应社群中心的角色）。更重要的是，不同于同质等价，结构等价不强调连通性；在网络中的节点可以离得很远，但它们仍具有相近的网络结构角色。在真实世界中，这些等价概念并不是排斥的；网络通常具有两者的行为。

我们观察到，BFS和DFS的策略在处理表示时扮演着重要角色，它影响着上述两种等价。特别的，BFS抽样的邻节点会导致embedding与结构等价更紧密。直觉上，我们注意到，为了探明结构等价，通常会对局部邻节点进行精准的描述。例如，基于网络角色（桥接：bridges、中心：hubs）的结构等价可以通过观察每个节点的立即邻节点观察到。通过将搜索限制到邻近节点，BFS达到了这种描述，并且获得了关于每个节点的邻近点的微观视角。另外，在BFS中，在抽样邻节点上的节点趋向于重复多次。这很重要，对于。

node2vec基于上述观察，论文设计了一种灵活的邻节点抽样策略，它允许我们在BFS和DFS间进行平衡。论文通过开发一种灵活的有偏随机游走过程，它可以以BFS和DFS的方式来探索邻节点。

随机游走直觉上，参数p和q控制着该walk从起始节点u进行探索和离开邻节点的快慢。特别的，该参数允许我们的搜索过程（近似）在BFS和DFS间进行插值，从而影响不同节点等价的紧密关系。

返回（Return）参数：p。参数p控制着在walk中立即访问一个节点的似然。将它设置成一个高值（> max(q,1)），可以确保在接下来的两步内对一个已经访问节点进行抽样的可能性变得很小。（除非在walk内的下一个节点没有其它邻居）。这种策略鼓励适度探索，避免在抽样时存在二跳内重复。另一方面，如果p很小（< min(q,1)），则鼓励在walk中重复访问已经访问过的节点，从而保持在局部区域内进行搜索。

入出（In-out）参数：q。参数q允许搜索在“inward”和”outward”节点间区分。如果q>1, 随机游走会偏向于更接近节点t的节点。这样的walk会根据在walk中各自的起始节点获得一个关于底层graph的局部视图，近似的BFS行为感觉上我们的抽样在一个小的局部内的节点组成。

作为对比，如果 q < 1，随机游走会倾向于更远离节点t的节点，从而鼓励更广泛的探索，近似DFS行为。这使得我们的抽样能够捕捉到更广泛的网络结构。

设置成关于一个在walk t内前继节点的函数，随机游走是2-order markovian。

node2vec实战

node2vec算法

node2vec代码

代码语言：javascript

代码运行次数：0

运行复制

调用方式

代码语言：javascript

代码运行次数：0

运行复制

以上就是GraphEmbedding实战系列：Node2vec原理与代码实战的详细内容，更多请关注php中文网其它相关文章！

方案	CPU核	内存	硬盘	带宽	IP地址	线路	价格/月	购买链接
韩国CN2	1–32C	1–128G	20–100G	3–20Mbps	1IPv4（原生）	CN2	¥38起
韩国CN2大带宽	1–32C	1–128G	20–100G	20–50Mbps	1IPv4（原生）	CN2	¥40起
韩国ISP	1–32C	1–128G	30–200G	100–300Mbps	1IPv4（双ISP）	国际线路	¥68起

规格参数	NVIDIA GeForce RTX 5090	NVIDIA GeForce RTX 4090
架构	Blackwell	Ada Lovelace
晶体管数量	920 亿	763 亿
CUDA 核心数	21760	16384
Shader 性能	125 TFLOPS	83 TFLOPS
Tensor Core	第五代，3,352 AI TOPS	第四代，1,321 AI TOPS
Ray Tracing	第四代，318 TFLOPS	第三代，191 TFLOPS
Clock Speed	2.01 GHz / 2.41 GHz	2.23 GHz / 2.52 GHz
DLSS 支持	DLSS 4	DLSS 3 / 3.5
显存容量	32 GB GDDR7	24 GB GDDR6X
内存总线宽度	512-bit	384-bit
内存带宽	1.8 TB/s	1 TB/s
功耗 (TDP)	575W	450W
建议零售价	$2600	$1800

测试模型	RTX 4090	RTX 5090	性能提升幅度
LLaMA 3.1 8B – Q4（测试 A）	126	167	0.325
LLaMA 3.1 8B – Q4（测试 B）	95	104	0.095
LLaMA 3.1 8B – Q4（测试 C）	108	126	0.167
LLaMA 3.1 8B – Instruct（FP16）	53	82	0.547
LLaMA 3.1 8B – Instruct（Q8）	87	123	0.414
LLaMA 3.2 3B – Q4	218	253	0.161
LLaMA 3.2 1B – Q4	338	384	0.136
LLaMA 3.2 3B – Q4（替代配置）	125	253	1.024
LLaMA 3.2 3B – Instruct（FP16）	108	159	0.472
LLaMA 3.2 1B – Instruct（FP16）	239	327	0.368

GPU	CPU	内存	硬盘	流量/带宽	数据中心	价格/月	购买链接
RTX40908	Intel 77022	512G	2T SSD	不限/1G	达拉斯	$3999
RTX 4090	AMD Ryzen 9950X	96GB DDR5	3.84TB NVMe Gen4	50T/10G	犹他州	$650
2xRTX4090	AMD EPYC 7443P	256GB DDR5	2×3.84TB NVMe Gen4	50T/10G	犹他州	$1299
RTX 4090	Intel i9 14900KF	96GB DDR5	2TB NVMe SSD	不限/1G	新泽西	$729
RTX 4090	Intel i9 14900K	64 GB DDR5	1T NVMe	不限/1G	纽约	$800
RTX5090	AMD Ryzen 9950X	96GB DDR5	3.84TB NVMe Gen4	50T/10G	犹他州	$899

相关推荐

热门标签

热门推荐

最新文章

如何在莱卡云云服务器上部署RustDesk服务器

一、部署RustDesk服务器准备工作

二、创建并配置莱卡云云服务器

三、安装RustDesk服务器

Amazon CloudFront加速内容分发教程

一、准备内容

二、进入Amazon CloudFront控制台

三、配置标准分发

四、查看更改

五、创建分发

六、禁用并删除分发（可选）

云服务器远程连接失败怎么操作及原因排查步骤

一、云服务器远程连接失败原因

二、排查远程云服务器连接失败步骤

服务器如何设置301重定向

一、热门网站服务器推荐

1、Hostinger虚拟主机

2、BlueHost虚拟主机

3、阿里云虚拟主机

如何使用RDP远程连接Windows服务器

RDP远程连接Windows服务器方法一：远程桌面连接

RDP远程连接Windows服务器方法二：mRemoteNG

RDP远程连接Windows服务器方法三：Parallels客户端

RDP远程连接Windows服务器方法四：MAC电脑

宝塔面板Docker部署Gogs教程

1、借助Docker安装

2、访问Gogs

3、运行配置Gogs

4、创建管理员账号

5、创建仓库

Xftp 8功能和特点介绍

一、Xftp 8功能

1、Xftp轻松传送文件

2、Xftp安全和高效

3、Xftp便捷管理

二、Xftp 8特点

1、Xftp文件传输调度

2、Xftp可继承的会话属性

3、Xftp文件快速搜索

4、Xftp图片缩略图预览

5、Xftp增强同步

PuTTY远程连接SSH图文教程

一、Windows系统用PuTTY连接SSH图文教程

二、Linux系统用PuTTY远程登录SSH图文教程

Nodejs安装及配置步骤（附价格、安装及配置教程）

一、Node.js是什么

1、Node.js 优点

2、Node.js 缺点

二、如何为网站安装Node.js

三、Node.js安装及配置步骤

1、如何cPanel中设置Node.js

2、如何使用命令行设置Node.js

AI应用下：RTX4090和RTX5090对比

一、NVIDIA RTX4090和RTX5090参数对比

二、RTX4090和RTX5090 AI性能对比

三、RTX4090和RTX5090成本效益对比

四、RTX4090和RTX5090核心改进对比

五、RTX4090和RTX5090实际性能对比

六、GPU服务器部署

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续提供更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫