Skip to content

2023年第一期有奖悬赏需求说明 #39

@Ritakang0451

Description

@Ritakang0451

一、 需求描述

  1. WeDataSphere各开源组件版本要求如下:
组件名 Apache Linkis DataSphere Studio Schedulis Qualitis Exchangis Visualis Streamis MYSQL JDK
版本号 1.3.1 1.1.1 0.7.1 0.9.2 1.0.0 1.0.0 0.2.0 5.1.49 1.8
  1. 底层计算存储引擎的版本要求如下,每个版本的适配,只接受一个Docker镜像成品:

社区常用版本如下,每人可认领一个版本:

a). CDH5.12.1 版本

组件名 Hadoop Hive Spark Flink Sqoop Trino
版本号 2.6.0-cdh5.12.1 1.1.0-cdh5.12.1 2.4.3 1.12.4 1.4.6 371

b). CDH6.3.2 版本

组件名 Hadoop Hive Spark Flink Sqoop Trino
版本号 3.0.0-cdh6.3.2 2.1.1-cdh6.3.2 3.0.0 1.12.4 1.4.6 371
  1. 编译规范

请参照 Linkis 版本适配 对 Apache Linkis 进行编译,其他组件无需编译,可直接使用官方安装包。

  1. 组件部署规范

● 安装部署目录规范

├── wedatasphere --根目录

│ ├── sbin --wedatasphere全家桶一键启动和一键停止的脚本目录

│ │ ├── start-all.sh --wedatasphere全家桶一键启动脚本

│ │ ├── stop-all.sh --wedatasphere全家桶一键停止脚本

│ │ ├── wedatasphere-env.sh --wedatasphere全家桶环境变量配置脚本

│ ├── install --wedatasphere各组件安装包的存放目录

│ │ ├── --LinkisInstall Linkis安装包根目录

│ │ ├── ……

│ ├── config --wedatasphere各组件配置文件的存放目录

│ │ ├── linkis-config --Linkis 配置文件根目录

│ │ ├── ……

│ ├── logs --wedatasphere各组件日志文件的存放目录

│ │ ├── linkis -- Linkis日志文件根目录

│ │ ├── ……

● 环境变量规范

wedatasphere-env.sh 可支持用户配置 Hadoop、Hive、Spark、Flink、Sqoop、Trino等引擎的环境变量,具体如下:

HADOOP_CONF_DIR=
HADOOP_HOME=
YARN_RESTFUL_URL=
HIVE_CONF_DIR=
HIVE_HOME=
HIVE_META_URL=
HIVE_META_USER=
HIVE_META_PASSWORD=
SPARK_CONF_DIR=
SPARK_HOME=
FLINK_HOME=
FLINK_CONF_DIR=
FLINK_LIB_DIR=
SQOOP_HOME=
SQOOP_CONF_DIR=
HCAT_HOME=

● 文档规范

文档尽量以图做说明,少用大段文字。

文档种类要求如下:

文档名称 安装部署文档 Demo使用文档 常见问题文档 升级指南 开发文档
文档内容 用于指导用户安装部署WeDataSphere全家桶 指导用户如何使用全家桶已有的Demo 安装过程中,可能出现的常见问题 指导用户如何只升级或替换WDS的某个组件 1. 给出目录层级结构解释
2. 给出启动逻辑
3. 如何新增一个全新的组件

● Demo规范

i) 官方将提供可导入的 DSS Demo项目,请在打镜像包之前,将Demo导入并保证Demo可正常执行。

ii) 官方将提供Scriptis Demo脚本,请在打镜像包之前,将Demo 脚本导入并保证可正常执行。

iii) 官方将提供 Streamis Demo 流式应用,请在打镜像包之前,将Demo 流式应用导入并保证可正常执行。

● Docker容器制作规范

i) 请尽量保证Docker容器包的总大小不超过12G;

ii) 请将 /wedatasphere 整个全家桶目录制作成一个容器镜像;

iii) 各组件配置的文件路径请使用相对路径,确保各组件可正常使用;

iv) 由于Linkis依赖底层Hadoop、Hive、Spark等组件,请注意提供Hadoop、Hive、Spark等底层计算存储引擎的配置文件的挂载规范和环境变量配置规范。

二、验收标准

  1. 文档齐全且质量高。

  2. 可按照安装部署文档,在30分钟内完成镜像的部署、启动和Demo的基本使用。

三、整体流程

1、和社区工作人员确认任务、接受任务;

2、社区工作人员在WeDataSphere项目,同步创建新的branch,并创建代码提交目录;

3、社区伙伴完成镜像的制作和验证后,提 PR,上传相关源代码和文档;

4、社区工作人员验证镜像包,验证无误后,合并 PR;

5、正式发布镜像包,发放奖励,进行社区宣传等。

四、时间规划

2月15日-2月22日 认领及需求沟通阶段
2月22日-3月08日 开发阶段
3月08日-3月22日 测试验收阶段

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions