MuMaXu's Blog

Hello,world!


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

大数据概述

发表于 2019-05-06 | 分类于 《大数据框架学习》
大数据的特性:4v规模性(Volume)大数据的特征首先就体现为“数量大”,存储单位从过去的GB到TB,直至PB、EB。随着信息技术的高速发展,数据开始爆发性增长。社交网络(微博、推特、脸书)、移动网络、各种智能终端等,都成为数据的来源。淘宝网近4亿的会员每天产生的商品交易数据约20TB;脸书约10亿的用户每天产生的日志数据超过300TB。迫切需要智能的算法、强大的数据处理平台和新的数据处理技术, ...
阅读全文 »

DeepWalk论文阅读学习笔记

发表于 2019-04-26 | 分类于 Graph Embedding
最近在看一些关于图网络的内容,初步入坑…之前看过那几篇赫赫有名的综述论文,看过后一个感觉:GNN是一个筐,什么都能往里面装。确实,这块很有研究价值,总的来讲就是使得机器学习能够处理Non Euclidean data。比如推荐系统、电子交易、计算几何、脑信号、分子结构等抽象出的图谱。这些图谱结构每个节点连接都不尽相同,有的节点有三个连接,有的节点有两个连接,是不规则的数据结构。以前机器学习只能处理 ...
阅读全文 »

数据结构算法题总结

发表于 2019-04-22 | 分类于 《剑指offer》
题目一:判断一棵二叉树是否是完全二叉树题目分析层序遍历 将所有的结点加入队列(包括空结点)。当遇到空结点时,查看其后面是否有空结点。若有,则二叉树不是完全二叉树。如果是满二叉树或者完全二叉树,这些空结点应该是在广度优先遍历的末尾,所以,当我们遍历到空洞的时候,整个二叉树就遍历完了。但如果是非完全二叉树,当遍历到空结点时,空结点后面还有非空结点。 C++代码123456789101112131415 ...
阅读全文 »

为什么要用交叉熵作为代价函数

发表于 2019-04-19 | 分类于 机器学习
对于大多数人来说,犯错是一件让人很不开心的事情。但反过来想,犯错可以让我们意识到自己的不足,然后我们很快就学会下次不能再犯错了。犯的错越多,我们学习进步就越快。 同样的,在神经网络训练当中,当神经网络的输出与标签不一样时,也就是神经网络预测错了,这时我们希望神经网络可以很快地从错误当中学习,然后避免再预测错了。那么现实中,神经网络真的会很快地纠正错误吗? 我们来看一个简单的例子: 上图是一个只 ...
阅读全文 »

《剑指offer》week7

发表于 2019-04-17 | 分类于 《剑指offer》 , C++
问题一:滑动窗口的最大值问题描述给定一个数组和滑动窗口的大小,请找出所有滑动窗口里的最大值。 例如,如果输入数组[2, 3, 4, 2, 6, 2, 5, 1]及滑动窗口的大小3,那么一共存在6个滑动窗口,它们的最大值分别为[4, 4, 6, 6, 6, 5]。 注意: 数据保证k大于0,且k小于等于数组长度。 样例 123输入:[2, 3, 4, 2, 6, 2, 5, 1] , k=3输出 ...
阅读全文 »

《剑指offer》week6

发表于 2019-04-16 | 分类于 《剑指offer》 , C++
问题一:0到n-1中缺失的数字问题描述一个长度为n-1的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围0到n-1之内。 在范围0到n-1的n个数字中有且只有一个数字不在该数组中,请找出这个数字。 样例 123输入:[0,1,2,4]输出:3 问题分析算法一:二分查找 $O(logn)$ 二分查找主要就是考虑我们要查找的值是在哪个区间,以及能否查找得到。 为什么说能否查找得到呢,比如这个题 ...
阅读全文 »

《剑指offer》week5

发表于 2019-04-15 | 分类于 《剑指offer》 , C++
问题一:数字序列中某一位的数字问题描述数字以0123456789101112131415…的格式序列化到一个字符序列中。 在这个序列中,第5位(从0开始计数)是5,第13位是1,第19位是4,等等。 请写一个函数求任意位对应的数字。 样例 123输入:13输出:1 问题分析这里需要通过三步来确定: 对于任给的一个数n,首先需要确定n这个数对应的是几位数,比如13对应的肯定是一个两位数,200对应 ...
阅读全文 »

Tensorflow加载预训练模型和保存模型

发表于 2019-04-15 | 分类于 Tensorflow
使用tensorflow过程中,训练结束后我们需要用到模型文件。有时候,我们可能也需要用到别人训练好的模型,并在这个基础上再次训练。这时候我们需要掌握如何操作这些模型数据。看完本文,相信你一定会有收获! Tensorflow模型文件我们在checkpoint_dir目录下保存的文件结构如下: 12345--checkpoint_dir| |--checkpoint| |--MyMode ...
阅读全文 »

《剑指offer》week3

发表于 2019-04-08 | 分类于 《剑指offer》 , C++
问题一:二叉搜索树的后序遍历序列问题描述输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果。 如果是则返回true,否则返回false。 假设输入的数组的任意两个数字都互不相同。 样例 123输入:[4, 8, 6, 12, 16, 14, 10]输出:true 问题分析二叉搜索数对应的就是树的中序遍历 在这里,首先通过后续遍历的结果找到根节点,也即是数组中的最后一个元素,然后在数组中 ...
阅读全文 »

Tensorflow学习笔记-输入数据处理框架

发表于 2019-04-05 | 分类于 Tensorflow
引入TensorFlow提供了一种统一的格式来存储数据,这个格式就是TFRecord。基于这个统一的数据格式,在处理数据的时候有一些通用的框架。这些通用的框架总结为获取文件列表、创建文件队列、图像预处理、合成Batch、设计损失函数、梯度下降算法。如图片总结如下: 获取文件列表、创建文件队列TFRecord介绍TFRecord数据文件是一种将图像数据和标签统一存储的二进制文件,能更好的利用内存, ...
阅读全文 »
1234
XuHejun

XuHejun

Stay hungry,stay foolish

38 日志
11 分类
18 标签
GitHub Zhihu Twitter Weibo
© 2019 XuHejun
本站访客数:
由 Hexo 强力驱动
|
主题 — NexT.Gemini v5.1.4