《数学之美》读书笔记
2022-04-30 09:10:45 21 举报
AI智能生成
登录查看完整内容
包含《数学之美》第三版核心概念和内容
作者其他创作
大纲/内容
有向图
判断句子是否合理
大数定理
统计
规则
方案
古德-图灵统计
有噪声更精准
技巧
自然语言处理*
最少词数匹配
分词后句子出现概率最大
分词
归一化
关键词频率
逆文本频率指数
TF-IDF
识别地址
应用
有限状态机
工程上简单实用的方法最好
费马小定律
正确的数学模型应该形式上是简单的
一个正确的模型可能一开始不如一个精致的错误模型
大量数据对研发重要
正确的模型也会受噪声干扰
最大熵模型:不把鸡蛋放在篮子里
bloom过滤器
区块链、密钥、量子密钥
人工智能的边界/数学的边界
相关理论
判断数组内容相同
相似hash
记录URL
信息指纹
有向权值图
神经元只能对输入变量做一次变换
结构:输入、神经元、输出
特点
google 大脑
人工神经网络
信息源
信道
接收者
通信模型
不确定性越大熵越大
信息是消除系统不确定性的唯一办法
H(X)=-E P(x)logP(x)
信息熵
增加了额外信息H(X)>=H(X|Y)
条件熵
两个随机事件的量化度量
I(X;Y)=H(X)-H(X|Y)
处理词的二义性
互信息
衡量两个取值为正数的函数相似性
两篇文章词频分布相对熵小,可能抄袭
相对熵
预测时,对未知的情况不做任何假设
文法分析
最大熵模型
信息论
图论
hash
爬虫
下载网页
建立索引
二维矩阵迭代
page rank
网页质量排名
用户偏好
相关性排序
权威性
排序
道
布尔代数
文献检索
索引
出链向量相关性
Clique 互链
反作弊
搜索引擎
余弦定理
分母缓存
只考虑非0元素
删除虚词
位置加权
优化
用特征向量
矩阵奇异值分解
一次算出所有新闻相关性
分类问题
最短路径
拼音转汉字
个性化语言模型
输入法
蒙特卡洛方法
简化
无监督
鲍姆-韦尔奇算法
训练算法
维特比算法
解码算法
扩展
隐马尔可夫
估算犯罪
条件随机场
概率引申:逻辑回归模型
贝叶斯网络
引申 Dijkstra
引申 Bellman-Ford
数学之美
0 条评论
回复 删除
下一页