Mining Heterogeneous Information Networks

Mining Heterogeneous Information Networks pdf epub mobi txt 电子书 下载 2026

出版者:Morgan & Claypool Publishers
作者:Yizhou Sun
出品人:
页数:160
译者:
出版时间:2012-7-23
价格:GBP 24.99
装帧:Paperback
isbn号码:9781608458806
丛书系列:
图书标签:
  • 数据挖掘
  • Networks
  • Heterogeneous
  • mining;
  • Information
  • 异质网络
  • data
  • 计算机
  • 信息网络
  • 异构数据
  • 数据挖掘
  • 图数据库
  • 机器学习
  • 知识图谱
  • 网络分析
  • 人工智能
  • 数据科学
  • HIN
想要找书就要到 本本书屋
立刻按 ctrl+D收藏本页
你会得到大惊喜!!

具体描述

Real-world physical and abstract data objects are interconnected, forming gigantic, interconnected networks. By structuring these data objects and interactions between these objects into multiple types, such networks become semi-structured heterogeneous information networks. Most real-world applications that handle big data, including interconnected social media and social networks, scientific, engineering, or medical information systems, online e-commerce systems, and most database systems, can be structured into heterogeneous information networks. Therefore, effective analysis of large-scale heterogeneous information networks poses an interesting but critical challenge.

In this book, we investigate the principles and methodologies of mining heterogeneous information networks. Departing from many existing network models that view interconnected data as homogeneous graphs or networks, our semi-structured heterogeneous information network model leverages the rich semantics of typed nodes and links in a network and uncovers surprisingly rich knowledge from the network. This semi-structured heterogeneous network modeling leads to a series of new principles and powerful methodologies for mining interconnected data, including: (1) rank-based clustering and classification; (2) meta-path-based similarity search and mining; (3) relation strength-aware mining, and many other potential developments. This book introduces this new research frontier and points out some promising research directions.

Table of Contents: Introduction / Ranking-Based Clustering / Classification of Heterogeneous Information Networks / Meta-Path-Based Similarity Search / Meta-Path-Based Relationship Prediction / Relation Strength-Aware Clustering with Incomplete Attributes / User-Guided Clustering via Meta-Path Selection / Research Frontiers

图书简介:深度学习在金融风控中的前沿应用与实践 书籍名称: 深度学习在金融风控中的前沿应用与实践 作者: [请在此处填写作者姓名,例如:张伟 / 王芳 / 等] 出版社: [请在此处填写出版社名称,例如:清华大学出版社 / 机械工业出版社] 页数/字数预估: 约 450 页 / 30 万字 ISBN: [请在此处填写 ISBN 号码] --- 内容概述 本书聚焦于当前金融科技领域最炙手可热的技术——深度学习(Deep Learning),系统性地阐述了其在风险控制(Risk Management)这一核心业务场景中的理论基础、前沿算法模型以及在实际业务中的落地部署与评估。在全球金融环境日益复杂、数据量呈指数级增长的背景下,传统基于统计学和专家经验的风控模型已难以应对新型欺诈手段和复杂的信用风险传导机制。本书旨在为金融机构的风控工程师、数据科学家、量化分析师以及相关领域的学术研究者提供一套全面、深入且具备高度实战价值的技术指南。 全书内容严格围绕如何利用深度神经网络的强大特征学习能力和非线性建模能力,优化信用评分、反欺诈检测、市场风险预警以及合规性监控等关键环节。书中不仅涵盖了基础的深度学习理论,更深入探讨了针对金融时序数据、高维稀疏数据以及非结构化数据(如文本、交易记录等)的定制化模型架构和训练策略。 --- 核心章节与内容详解 本书共分为六大部分,二十个章节,层层递进,从理论基石到复杂应用,构建了一个完整的知识体系。 第一部分:金融风控的挑战与深度学习的机遇(理论基础与数据准备) 本部分首先界定了现代金融风控面临的核心痛点:数据维度爆炸、黑箱模型解释性差、以及对实时决策的高要求。随后,系统回顾了传统风控方法(如Logistic回归、决策树)的局限性。重点阐述了深度学习,尤其是DNN、CNN和RNN在处理金融异构数据时的内在优势,如自动特征提取和高阶非线性关系建模能力。 数据工程的金融特有性: 强调了金融数据的清洗、标准化、缺失值处理(尤其是针对账户行为数据)以及时间序列对齐的重要性。引入了时间窗口特征工程的深度学习化处理方法。 可解释性(XAI)的引入: 鉴于金融监管的严格要求,本章详细介绍了 LIME、SHAP 等可解释性工具在深度模型中的应用,确保模型决策过程的透明度。 第二部分:深度神经网络在信用风险建模中的应用 信用风险是金融机构面临的最根本风险之一。本部分将信用评分模型的构建过程迁移至深度学习框架下。 多层感知机(MLP)与深度信用评分卡: 介绍如何利用更深层次的网络结构取代传统线性模型,实现对借款人风险画像的精细刻画。重点探讨了激活函数选择、正则化技术在防止过拟合中的作用。 循环神经网络(RNN/LSTM/GRU)处理行为序列: 针对用户的历史还款记录、交易流水等时间序列数据,讲解如何利用序列模型捕捉用户行为的动态变化和潜在的风险拐点。 自编码器(Autoencoders)的应用: 探讨如何利用变分自编码器(VAE)进行数据降维、特征学习,并在小样本或极端风险事件下进行异常检测和风险因子重建。 第三部分:实时反欺诈系统的深度学习架构 随着移动支付和线上信贷的普及,实时欺诈检测的准确性和速度成为关键。 图神经网络(GNN)的赋能: 鉴于欺诈行为通常表现出团伙性、关联性的特征,本书花费大量篇幅介绍 GCN、GraphSAGE 等图神经网络模型如何有效建模用户、设备、IP地址、资金流之间的复杂关系图谱,发现潜在的欺诈团伙。 时空深度模型(ST-GNN): 针对具有明确时间戳和地理位置信息的交易数据,介绍如何融合时间和空间信息,构建更精准的实时交易风险预警系统。 集成学习与深度模型融合: 探讨如何将传统机器学习模型(如XGBoost)的优势与深度模型的非线性拟合能力结合,构建混合集成反欺诈系统,以提高整体的召回率和精确率。 第四部分:市场风险、流动性风险与量化交易中的前沿模型 超越传统的信用和欺诈领域,本书深入探讨深度学习在宏观风险管理中的潜力。 深度强化学习(DRL)在资产配置中的应用: 介绍 DRL 如何通过与模拟或真实市场环境的交互,自动学习最优的投资组合调整策略,以应对波动性和流动性风险。 Transformer模型对宏观经济指标和新闻文本的处理: 展示如何利用 Transformer 架构(如 BERT 的变体)处理海量的非结构化金融新闻和研报,提取情绪指标和潜在的市场冲击因子,用于市场风险敞口的实时监控。 生成对抗网络(GANs)在压力测试中的作用: 讲解如何利用 GANs 生成高度逼真但符合特定风险参数分布的合成金融时间序列数据,以更有效地对金融机构进行压力测试和资本充足率评估。 第五部分:模型部署、监控与监管合规 理论模型的成功落地是风控系统的核心价值所在。本部分聚焦于生产环境中的实践操作。 模型服务化与性能优化: 讨论模型在生产环境中的低延迟推理需求,涉及 TensorFlow Serving、ONNX 等工具的使用,以及模型量化、剪枝等加速技术。 模型漂移(Model Drift)的实时监测: 金融环境变化极快,模型性能会随时间衰减。介绍基于统计检验和深度漂移度量指标的实时监控框架,确保模型持续有效。 对抗性攻击与模型鲁棒性: 探讨欺诈者可能采用的对抗性样本攻击,并提出防御机制,如对抗性训练,以提高风控模型的安全性。 读者对象 本书面向具有一定概率统计、机器学习基础的专业人士,包括: 1. 金融机构风控部门: 专注于信用风险、反欺诈、反洗钱(AML)的工程师和数据科学家。 2. 金融科技公司: 致力于构建新一代智能信贷、保险理赔自动化系统的研发人员。 3. 高校与研究机构: 对金融工程、人工智能交叉学科感兴趣的研究生和教师。 本书以严谨的学术态度为基础,兼顾前沿技术的工程实现细节,致力于成为深度学习应用于金融风控领域的权威参考手册。

作者简介

Yizhou Sun received her Ph.D. in Computer Science from the University of Illinois at Urbana-Champaign in 2012. She will be an assistant professor in the College of Computer and Information Science at Northeastern University. Her principal research interest is in mining information and social networks, and more generally in data mining, database systems, statistics, machine learning, information retrieval, and network science, with a focus on modeling novel problems and proposing scalable algorithms for large-scale, real world applications. Yizhou has over 30 publications in books, journals, and major conferences. Tutorials based on her thesis work on mining heterogeneous information networks have been given in several premier conferences, including EDBT 2009, SIGMOD 2010, KDD 2010, ICDE 2012, VLDB 2012, and ASONAM 2012. She received ACM KDD 2012 Best Student Paper Award.

Jiawei Han is the Abel Bliss Professor of Computer Science at the University of Illinois at Urbana-Champaign. His research includes data mining, information network analysis, database sys-tems, and data warehousing, with over 600 journal and confer-ence publications. He has chaired or served on many program committees of international conferences, including PC co-chair for KDD, SDM, and ICDM conferences, and Americas Coor-dinator for VLDB conferences. He also served as the founding Editor-In-Chief of ACM Transactions on Knowledge Discovery from Data and is serving as the Director of Information Network Academic Research Center supported by U.S. Army Research Lab. He is Fellow of ACM and Fellow of IEEE, and received 2004 ACM SIGKDD Innovations Award, 2005 IEEE Computer Society Technical Achievement Award, 2009 IEEE Computer So-ciety Wallace McDowell Award, and 2011 Daniel C. Drucker Eminent Faculty Award at UIUC. His book,Data Mining: Concepts and Techniques, has been used popularly as a textbook worldwide.

目录信息

http://www.morganclaypool.com/doi/abs/10.2200/S00433ED1V01Y201207DMK005
· · · · · · (收起)

读后感

评分

评分

评分

评分

评分

用户评价

评分

韩老师颇为推荐的书,大约因为作者是他的爱徒吧。data mining的书都是看起来有道理,但感觉不算非常solid。。。去年KDD就有人吐槽allmodels are wrong, some are useful。。。

评分

今年Heterogeneous Network相关工作明显火了,阿里推荐的场景比GBDT+Metapth2vec高了2.3%。但总觉得一味GNN不是办法,看看以前的工作还是好的。

评分

..................

评分

meta path 让我想到了前段时间老师让看的引文分析里面的“主路径分析法”,both interesting

评分

meta path 让我想到了前段时间老师让看的引文分析里面的“主路径分析法”,both interesting

本站所有内容均为互联网搜索引擎提供的公开搜索信息,本站不存储任何数据与内容,任何内容与数据均与本站无关,如有需要请联系相关搜索引擎包括但不限于百度google,bing,sogou

© 2026 onlinetoolsland.com All Rights Reserved. 本本书屋 版权所有