Ubuntu 安装 superset

1 简介

Apache Superset是一个开源软件云原生应用程序,用于数据探索和数据可视化,能够处理PB级数据。该应用程序最初是由Maxime Beauchemine在Airbnb工作时的一个黑客项目,并于2017年进入了Apache Incubator计划。

本文基于 ubuntu 20.04 64bit , python 3.8.2 , apache-superset 1.0.1, mariadb-server 来安装配置。superset 基于 Flask 开发的 ,默认使用的是 sqlite 数据库。

2 安装系统环境

安装系统基本环境

sudo apt-get install build-essential libssl-dev libffi-dev python3-dev python3-pip libsasl2-dev libldap2-dev python3-venv libmariadb-dev

由于众所周知的网络环境原因,这里需要添加对域名的解释到 /etc/hosts

echo "151.101.108.133 raw.githubusercontent.com" >> /etc/hosts

配置虚拟环境并激活

mkdir mysuperset
cd mysuperset
python3 -m venv venv
. venv/bin/activate

3 安装 superset

安装依赖环境

pip install wheel 
pip install mysqlclient
pip install Pillow

安装 superset

pip install apache-superset

初始化数据库

superset db upgrade

创建程序的管理员

export FLASK_APP=superset
superset fab create-admin

加载案例数据

superset load_examples

创建默认角色和权限

superset init

在8088端口启动一个开发模式的服务器

superset run -h 0.0.0.0 -p 8088 --with-threads --reload --debugger

4 配置 superset

4.1 设置为中文

superset 1.0.1 版本自带的中文语言包翻译质量一般,建议去 https://github.com/apache/superset/tree/master/superset/translations/zh/LC_MESSAGES 下载最新的语言包,然后用 poedit 程序打开 messages.po 文件转成 messages.mo 文件,再替换原来的 mo 和 json 文件。

在 ~/mysuperset/venv/lib/python3.8/site-packages/superset/config.py 中进行配置,修改原来的 en 为 zh 。

BABEL_DEFAULT_LOCALE = "zh"

4.2 配置缓存

默认没有启用缓存,建议启用。在 config.py 文件中找到以下两行,把 null 修改为 simple

CACHE_CONFIG: CacheConfig = {"CACHE_TYPE": "simple"}
DATA_CACHE_CONFIG: CacheConfig = {"CACHE_TYPE": "simple"}

5 退出

关掉服务器后退出虚拟环境

deactivate

中国神奇的人物

在中国,除开神奇的图书馆员、实验员之外,还有一群神奇的和尚,有多神奇?

古语有云:天下武功出少林,牛叉极客入龙泉。你知道龙泉寺的科研实力有多强吗?龙泉寺部分高僧名录摘录如下:贤威法师,龙泉寺管理委员会秘书,中科院生物物理研究所博士;贤启法师,龙泉寺管委会的五位成员之一,清华大学核能和热能物理博士;2010年出现在报道上的第47届国际数学奥赛金牌、北大数学系高材生柳智宇,在龙泉寺清修3年后,已经正式剃度成为法师,法号贤宇,目前在寺内负责校律工作,主要是整理编校一些佛教典籍……

龙泉寺2014年科研项目是这样的:《大数据时代云计算推动沙门信息化研究》、《基于社会网络的西方八百罗汉关系研究》、《基于文本数据挖掘的梵文分词研究》、《大数据时代的佛家信息管理》、《论SNS在各法门寺弟子交流之间的应用》……

 

原文链接:http://www.guancha.cn/society/2014_01_05_197464.shtml