-
一份价值百万的大数据分析报告如何炼成?
所属栏目:[大数据] 日期:2020-12-31 热度:152
作者 | 江颖 大数据文摘欢迎各类优质稿件 请联系 tougao@bigdatadigest.cn 序 曾经,咨询公司一份报告就能收取企业几十万、甚至于上百万。而今,矫枉过正,数据分析报告却常常被企业认为没有任何实际价值。我经常和企业交流,他们告诉我,需要的是能够为他带[详细]
-
什么是AI,叫人工智能,和BI,商业智能有什么区别
所属栏目:[大数据] 日期:2020-12-31 热度:200
人工智能(Artificial Intelligence) ,英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是 计算机科学 的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出[详细]
-
如何用大数据实现用户价值的最大化
所属栏目:[大数据] 日期:2020-12-31 热度:160
来源:易观智库 1 大数据中的用户分析 首先,我们为什么要去做用户分析? 面临繁琐的数据之中,需要做什么分析?怎么去提取数据?在建立用户画像模型的过程中,区分用户特征的关键点是什么?应该从哪些方面去寻找用户的特征?其实这个问题扩大化以后需要解决[详细]
-
算法提高 大数加法
所属栏目:[大数据] 日期:2020-12-31 热度:87
问题描述 输入两个正整数a,b,输出a+b的值。 输入格式 两行,第一行a,第二行b。a和b的长度均小于1000位。 输出格式 一行,a+b的值。 样例输入 4 2 样例输出 6 #includestdio.h#includestring.hvoid fun(int n,int sum[]){int temp,i;for(i=0;in;i++){temp=s[详细]
-
[bigdata-031] python3+selenium 做抓取
所属栏目:[大数据] 日期:2020-12-31 热度:198
1. 安装 1.1 pip3 install -U selenium 1.2 下载 https://github.com/mozilla/geckodriver/releases/download/v0.13.0/geckodriver-v0.13.0-linux64.tar.gz? 解压缩,然后放到/usr/bin目录 2. 抓取豆瓣 #!/usr/bin/env python3#!-*- coding:utf-8 -*-import[详细]
-
logminer挖掘
所属栏目:[大数据] 日期:2020-12-31 热度:84
1.???? Logminer介绍 LogMiner 是Oracle公司从产品8i以后提供的一个实际非常有用的分析工具,使用该工具可以轻松获得Oracle 重做日志文件(归档日志文件)中的具体内容,LogMiner分析工具实际上是由一组PL/SQL包和一些动态视图组成,它作为Oracle数据库的一[详细]
-
27、Power Query-日期与时间数据处理实例(图书室借书统计)
所属栏目:[大数据] 日期:2020-12-31 热度:94
本节要点:Power Query-日期与时间数据处理实例(图书室借书统计) 承接上一节的需求,我们引入切片器的功能,对图书室的借书以及归还情况进行查询和筛选,效果图如下: 对“借书状态”和“归还状态”进行筛选,亦可同时筛[详细]
-
25、Power Query-日期与时间数据处理
所属栏目:[大数据] 日期:2020-12-31 热度:157
本节知识点:Power Query-日期与时间数据处理 日期与时间数据处理功能位置(同样在“转换”和“添加列”菜单中都存在): 这里重点讲解一下某些知识点。 比如年限:意思是当前系统日期减去选中列的日期,结果以“天时分秒毫秒”方式显示。 月份下面的“一个[详细]
-
媒体|郑宇:用大数据预测雾霾是如何做到的?
所属栏目:[大数据] 日期:2020-12-31 热度:52
(本文由澎湃新闻授权转载。) ? 全球范围里,有超过半数的人类居住在城市之中,城市化的进程也从未停止过。面对越来越庞大的城市,许多事情已经超出了控制:拥堵的交通,严重的空气污染,让人烦躁的噪音等等。 ? 没有人真正了解城市中到底发生了什么,也没[详细]
-
(26进制大数相加)hdu 2100 Lovekey
所属栏目:[大数据] 日期:2020-12-31 热度:116
Lovekey Problem Description XYZ-26进制数是一个每位都是大写字母的数字。 A、B、C、…、X、Y、Z 分别依次代表一个0 ~ 25 的数字,一个 n 位的26进制数转化成是10进制的规则如下A0A1A2A3…An-1 的每一位代表的数字为a0a1a2a3…an-1 ,则该XYZ-26进制数的10[详细]
-
如何利用图像识别、语音识别、文本挖掘做好鉴黄?
所属栏目:[大数据] 日期:2020-12-31 热度:69
人工智能鉴黄市场竞争愈发激烈,目前图普科技、阿里绿网、腾讯万象优图等团队已占据大量市场份额,在此环境下,不少公司试图通过提供更全面的服务从这片红海中分一杯羹。 那么更全面的定制服务体现在哪些地方?雷锋网(公众号:雷锋网)特地采访了极限元 CEO[详细]
-
打包带走!史上最全的大数据分析和制作工具
所属栏目:[大数据] 日期:2020-12-31 热度:64
来源: 数之联大数据(ID:unionbigdata) 工欲善其事,必先利其器。 作为在大数据领域摸爬滚打叱咤风云的伙计们,也应当有一些实用工具来辅助工作日常。下面是小编精心整理的一些经检测非常实用的工具及网站,呈给大家~~ 数据可视化工具 说到数据呈现,必然[详细]
-
[bigdata-027] 最好用的 python+mysql的包:pymysql
所属栏目:[大数据] 日期:2020-12-31 热度:50
pip3 install pymysql import? pymysqlconn = pymysql.connect(host='127.0.0.1',port=3306,user='root',passwd='tiger88',db='spider_phone',charset='utf8')c = conn.cursor()c.execute('select * from phone_info limit 1;')r = c.fetchone()print(r)prin[详细]
-
数据可视化:手把手打造BI
所属栏目:[大数据] 日期:2020-12-31 热度:66
本文是 如何七周成为数据分析师 的第六篇教程,如果想要了解写作初衷,可以先行阅读七周指南。温馨提示:如果您已经熟悉BI,大可不必再看这篇文章,或只挑选部分。 我们上一篇 数据可视化:教你打造升职加薪的报表 教大家如何制作清晰美观的报表以及相应技巧[详细]
-
下一代大数据处理平台Apache Beam成为Apache顶级项目
所属栏目:[大数据] 日期:2020-12-31 热度:105
Apache软件基金会在2017年01月10正式宣布Apache Beam从孵化项目毕业,成为Apache的顶级项目 Apache Beam(原名Google DataFlow)是Google在2016年2月份贡献给Apache基金会的Apache孵化项目,被认为是继MapReduce,GFS和BigQuery等之后,Google在大数据处理领域[详细]
-
26、Power Query-日期与时间数据处理实例(统计出某年各月各周的
所属栏目:[大数据] 日期:2020-12-31 热度:179
本节重点:Power Query-日期与时间数据处理实例(统计出某年各月各周的借书人数) 需求如下: 上图所示,根据左侧的数据源,统计出2016年各月各周的借书人数(效果如右侧所示)。 分析:很明显,这个需求是对日期的一个操作,其实仅需要用到左侧的第一列即可[详细]
-
[bigdata-028]apache nifi 从mysql导出数据到hbase
所属栏目:[大数据] 日期:2020-12-31 热度:116
0.在hbase节点,启动thrift服务 hbase-daemon.sh start thrift 1. 在本机启动nif ./bin/nifi.sh start 2. 在浏览器输入http://localhost:8080/nifi,看到nifi的界面 3. 拖一个processor ExecuteSQL到界面 ??? 3.1 在processor上点击右键,选择configure,点[详细]
-
Presto 常用配置及操作
所属栏目:[大数据] 日期:2020-12-26 热度:165
一、介绍 Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。 Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。 推荐阅读 Presto实现原理和美团的使用实践 二、安装 2.1[详细]
-
大数据的技术生态概述(转载)
所属栏目:[大数据] 日期:2020-12-26 热度:63
如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆,各有各[详细]
-
九种常见的数据分析模型
所属栏目:[大数据] 日期:2020-12-26 热度:167
1. 漏斗分析模型 漏斗分析是一套流程式数据分析,它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析模型。 运营人员可以通过观察不同属性的用户群体(如新注册用户与老客户、不同渠道来源的客户)各环节转化率,各流程步骤转化率的[详细]
-
大数据领域常用技术栈
所属栏目:[大数据] 日期:2020-12-26 热度:146
提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得非常迅速的发[详细]
-
Databricks说的Lakehouse是什么?
所属栏目:[大数据] 日期:2020-12-26 热度:64
? 在过去的几年里,Lakehouse作为一种新的数据管理范式,已独立出现在Databricks的许多用户和应用案例中。在这篇文章中,我们将阐述这种新范式以及它相对于之前方案的优势。 数据仓库在决策支持和商业智能应用方面有着悠久的历史。自20世纪80年代末问世以来[详细]
-
A-B Problem 大数相等
所属栏目:[大数据] 日期:2020-12-26 热度:185
A-B Problem http://acm.nyist.net/JudgeOnline/problem.php?pid=524 时间限制:1000?ms ?|? 内存限制:65535?KB 难度:3 输入 有多组测试数据。每组数据包括两行,分别代表A和B。 它们的位数小于100,且每个数字前中可能包含+,- 号。 每个数字前面和后面都[详细]
-
大数据时代必不可少的大数据分析和制作工具大全
所属栏目:[大数据] 日期:2020-12-26 热度:160
1.微信大数据分析工具 新媒体指数:http://www.gsdata.cn 2.数据可视化工具 百度ECharts:http://echarts.baidu.com/ Cytoscape:http://www.cytoscape.org/ 图表秀:http://www.tubiaoxiu.com/ 数据观:http://shujuguan.cn/ 微博足迹可视化:http://vis.pk[详细]
-
A+B Problem II 大数加法
所属栏目:[大数据] 日期:2020-12-26 热度:89
A+B Problem II http://acm.nyist.net/JudgeOnline/problem.php?pid=103 时间限制:3000?ms ?|? 内存限制:65535?KB 难度:3 输入 The first line of the input contains an integer T(1=T=20) which means the number of test cases. Then T lines follow,e[详细]