Ubuntu 安装 superset

1 简介

Apache Superset是一个开源软件云原生应用程序,用于数据探索和数据可视化,能够处理PB级数据。该应用程序最初是由Maxime Beauchemine在Airbnb工作时的一个黑客项目,并于2017年进入了Apache Incubator计划。

本文基于 ubuntu 20.04 64bit , python 3.8.2 , apache-superset 1.0.1, mariadb-server 来安装配置。superset 基于 Flask 开发的 ,默认使用的是 sqlite 数据库。

2 安装系统环境

安装系统基本环境

sudo apt-get install build-essential libssl-dev libffi-dev python3-dev python3-pip libsasl2-dev libldap2-dev python3-venv libmariadb-dev

由于众所周知的网络环境原因,这里需要添加对域名的解释到 /etc/hosts

echo "151.101.108.133 raw.githubusercontent.com" >> /etc/hosts

配置虚拟环境并激活

mkdir mysuperset
cd mysuperset
python3 -m venv venv
. venv/bin/activate

3 安装 superset

安装依赖环境

pip install wheel 
pip install mysqlclient
pip install Pillow

安装 superset

pip install apache-superset

初始化数据库

superset db upgrade

创建程序的管理员

export FLASK_APP=superset
superset fab create-admin

加载案例数据

superset load_examples

创建默认角色和权限

superset init

在8088端口启动一个开发模式的服务器

superset run -h 0.0.0.0 -p 8088 --with-threads --reload --debugger

4 配置 superset

4.1 设置为中文

superset 1.0.1 版本自带的中文语言包翻译质量一般,建议去 https://github.com/apache/superset/tree/master/superset/translations/zh/LC_MESSAGES 下载最新的语言包,然后用 poedit 程序打开 messages.po 文件转成 messages.mo 文件,再替换原来的 mo 和 json 文件。

在 ~/mysuperset/venv/lib/python3.8/site-packages/superset/config.py 中进行配置,修改原来的 en 为 zh 。

BABEL_DEFAULT_LOCALE = "zh"

4.2 配置缓存

默认没有启用缓存,建议启用。在 config.py 文件中找到以下两行,把 null 修改为 simple

CACHE_CONFIG: CacheConfig = {"CACHE_TYPE": "simple"}
DATA_CACHE_CONFIG: CacheConfig = {"CACHE_TYPE": "simple"}

5 退出

关掉服务器后退出虚拟环境

deactivate

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据