MuMaXu's Blog

Hello,world!


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

《剑指offer》week3

发表于 2019-04-01 | 分类于 《剑指offer》 , C++
问题一:反转链表题目描述定义一个函数,输入一个链表的头结点,反转该链表并输出反转后链表的头结点。 样例 123输入:1->2->3->4->5->NULL输出:5->4->3->2->1->NULL 题目分析(链表操作,迭代) $O(n)$ 翻转即将所有节点的$next$指针指向前驱节点。 由于是单链表,我们在迭代时不能直接找到前驱节点, ...
阅读全文 »

数据预处理

发表于 2019-03-31 | 分类于 机器学习
概述数据预处理和特征选择是数据挖掘与机器学习中关注的重要问题,坊间常说:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。特征工程就是将原始数据转化为有用的特征,更好的表示预测模型处理的实际问题,提升对于未知数据的预测准确性。 缺失值处理 数据缺失值的产生的原因多种多样,主要分为客观原因和人为原因。 客观原因:比如数据存储的失败、存储器损坏、机械故障导致某段时间数据未能收集(对于 ...
阅读全文 »

《剑指offer》 week2

发表于 2019-03-27 | 分类于 《剑指offer》 , C++
问题一:机器人的运动范围题目描述地上有一个$m$行和$n$列的方格,横纵坐标范围分别是 $0∼m−1$和$0∼n−1$。 一个机器人从坐标0,0的格子开始移动,每一次只能向左,右,上,下四个方向移动一格。 但是不能进入行坐标和列坐标的数位之和大于$k$的格子。 请问该机器人能够达到多少个格子? 样例1 123输入:k=7, m=4, n=5输出:20 样例2 123456输入:k=18, m=40 ...
阅读全文 »

图神经网络的模型与应用

发表于 2019-03-25 | 分类于 图神经网络
简介神经网络近期的成功推动了模式识别和数据挖掘的研究,许多机器学习任务,例如目标检测,机器翻译,语音识别,曾经都严重依赖棘手的特征工程提取数据集的特征,现在已经被端到端的学习模式彻底改变,也就是卷积神经网络(CNN),长短时记忆网络(LSTM),和自编码(AE)。深度学习在许多领域的成功部分归功于快速发展的计算资源(如GPU)和大量训练数据,部分归功于深度学习从欧氏数据(如图像、文本和视频)中提取 ...
阅读全文 »

《剑指offer》week1

发表于 2019-03-22 | 分类于 《剑指offer》 , C++
问题一:找出数组中重复的数题目描述给定一个长度为$n$的整数数组 nums,数组中所有的数字都在 $0∼n−1$的范围内。 数组中某些数字是重复的,但不知道有几个数字重复了,也不知道每个数字重复了几次。 请找出数组中任意一个重复的数字。 注意:如果某些数字不在 $0∼n−1$的范围内,或数组中不包含重复数字,则返回 -1; 样例 123给定 nums = [2, 3, 5, 4, 3, 2, 6, ...
阅读全文 »

机器学习中正则化项L1和L2的直观理解

发表于 2019-03-06 | 分类于 机器学习
正则化(Regularization)机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作$\ell_{1}$ -norm和$\ell_{2}-$ norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数。 L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型,使用L1正则化的模型建叫做L ...
阅读全文 »

用强化学习为图论组合优化问题寻找“元算法”

发表于 2019-02-18
介绍从交通优化、信息传播优化、用户网络分析,组合优化这一传统计算问题在日常应用中无处不在。然而,这类问题往往是NP难题(NP-hard),并需要大量的专业知识和试错来解决。在许多实际生活的应用中,相似的组合优化问题一次又一次的出现,而每次面对具有相同形式、但数据不同的问题,却需要大量人力一遍又一遍的设计新的算法方案。基于图的组合优化问题多年来受到理论和算法设计界的广泛关注。 传统的解决NP-har ...
阅读全文 »

一步步推导SVM公式

发表于 2019-02-17 | 分类于 机器学习
线性可分支持向量机给定一个特征空间上的训练数据集$\mathbb { D } = \left\{ \left( \vec { \mathbf { x } } _ { 1 } , \tilde { y } _ { 1 } \right) , \left( \vec { \mathbf { x } } _ { 2 } , \tilde { y } _ { 2 } \right) , \cdots , ...
阅读全文 »

浅谈Word2Vec

发表于 2019-01-03 | 分类于 机器学习
什么是Word2VecWord2Vec是从大量文本语料中以有监督的方式学习语义知识的一种模型,它被大量地用在自然语言处理(NLP)中。那么它是如何帮助我们做自然语言处理呢?Word2Vec其实就是通过学习文本来用词向量的方式表征词的语义信息,即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。Embedding其实就是一个映射,将单词从原先所属的空间映射到新的多维空间中,也就是把原先词所在空 ...
阅读全文 »

吴恩达序列模型————循环序列模型

发表于 2018-12-24 | 分类于 机器学习
数学符号(输出y也是类似)$x ^ { ( i ) }$:表示第i个样本 $x ^ { ( i ) < t > }$:第i个样本第t个输入 $T _ { x } ^ { ( i ) }$:表示第i个样本的序列长度 循环神经网络为什么不用标准的神经网络 输入和输出数据在不同的例子中可以有不同的长度; 这种朴素的神经网络结果并不能共享从文本不同位置所学习到的特征。(如卷积神经网络中学到的特 ...
阅读全文 »
1234
XuHejun

XuHejun

Stay hungry,stay foolish

38 日志
11 分类
18 标签
GitHub Zhihu Twitter Weibo
© 2019 XuHejun
本站访客数:
由 Hexo 强力驱动
|
主题 — NexT.Gemini v5.1.4