专属域名
文档搜索
轩辕助手
Run助手
邀请有礼
返回顶部
快速返回页面顶部
收起
收起工具栏

folioorg/mod-data-import Docker 镜像 - 轩辕镜像

mod-data-import
folioorg/mod-data-import
FOLIO项目的mod-data-import模块Docker镜像,提供数据导入处理功能,支持文件拆分、作业优先级评分、S3存储集成与Kafka消息处理,适用于图书馆服务平台的批量数据导入场景。
0 次下载activefolioorg镜像
🚀专业版镜像服务,面向生产环境设计
中文简介版本下载
🚀专业版镜像服务,面向生产环境设计

mod-data-import Docker镜像文档

镜像概述

mod-data-import是FOLIO(图书馆开源服务平台)的核心模块之一,主要用于处理批量数据导入任务。该镜像封装了数据导入相关的服务逻辑,支持与对象存储、消息队列集成,提供文件拆分、作业优先级评分等功能,满足图书馆系统中大规模数据导入的需求。

代码仓库:[***]

核心功能和特性

  • 数据导入处理:支持批量数据导入流程管理,包括任务创建、执行与监控
  • 文件拆分机制:可配置是否启用文件拆分,自定义每拆分文件的记录数
  • 作业优先级评分:基于任务大小、创建时间、租户使用情况等多维度计算作业优先级
  • S3存储集成:支持与S3兼容对象存储对接,用于导入文件的存储与读取
  • Kafka消息集成:通过Kafka实现异步消息处理,支持分布式部署架构
  • 多租户支持:针对多租户环境优化作业调度,基于租户使用情况调整任务优先级

使用场景

  • FOLIO图书馆服务平台的批量数据导入(如Marc记录、用户数据、资源元数据等)
  • 需要与对象存储(S3或兼容S3的存储服务)集成的大规模文件导入场景
  • 需通过Kafka实现异步消息处理的分布式数据导入系统
  • 对导入作业优先级有精细化管理需求的多租户环境

使用方法和配置说明

基础运行命令
bash
docker run -d \
  -p 8081:8081 \
  -e DB_HOST=your-db-host \
  -e DB_PORT=5432 \
  -e DB_NAME=folio \
  -e DB_USER=folio_user \
  -e DB_PASSWORD=folio_password \
  -e KAFKA_HOST=your-kafka-host \
  -e KAFKA_PORT=9092 \
  -e AWS_BUCKET=your-bucket \
  -e AWS_ACCESS_KEY_ID=your-access-key \
  -e AWS_SECRET_ACCESS_KEY=your-secret-key \
  folio/mod-data-import
关键配置参数
基础配置
  • Module port: 8081(容器内服务端口,需映射至主机)
  • Container memory: 542293850 bytes(约542MB,建议运行时分配不低于此内存)
  • JAVA_OPTIONS: -XX:MaxRAMPercentage=66.0 -Djava.util.logging.config.file=vertx-default-jul-logging.properties(JVM参数,默认已配置)
数据库连接(必填)

需通过环境变量配置数据库连接信息(原文档未提供默认值,需用户自行设置):

  • DB_HOST: 数据库主机地址
  • DB_PORT: 数据库端口
  • DB_NAME: 数据库名称
  • DB_USER: 数据库用户名
  • DB_PASSWORD: 数据库密码
Kafka配置
  • KAFKA_HOST: Kafka服务主机地址,默认10.0.2.15
  • KAFKA_PORT: Kafka服务端口,默认9092
S3存储配置
  • AWS_URL: S3服务URL,默认[***](兼容S3的存储服务地址)
  • AWS_REGION: S3区域(无默认值)
  • AWS_BUCKET: S3存储桶名称,默认example-bucket
  • AWS_ACCESS_KEY_ID: S3访问密钥ID,默认AKIAIOSFODNN7EXAMPLE
  • AWS_SECRET_ACCESS_KEY: S3密钥,默认wJalrXUtnFEMI/K7MDENG/EXAMPLEKEY
  • AWS_SDK: 是否启用AWS SDK,默认false
  • S3_FORCEPATHSTYLE: 是否强制使用路径样式访问,默认false
文件拆分配置
  • SPLIT_FILES_ENABLED: 是否启用文件拆分,默认false
  • RECORDS_PER_SPLIT_FILE: 每个拆分文件的记录数,默认1000
作业优先级评分配置
  • SCORE_JOB_SMALLEST: 小作业评分值,默认40
  • SCORE_JOB_LARGEST: 大作业评分值,默认-40
  • SCORE_JOB_REFERENCE: 作业大小参考值,默认***
  • SCORE_AGE_NEWEST: 最新作业年龄评分,默认0
  • SCORE_AGE_OLDEST: 最旧作业年龄评分,默认50
  • SCORE_AGE_EXTREME_THRESHOLD_MINUTES: 极端年龄阈值(分钟),默认480(8小时)
  • SCORE_AGE_EXTREME_VALUE: 极端年龄评分值,默认***
  • SCORE_TENANT_USAGE_MIN: 租户低使用率评分,默认100
  • SCORE_TENANT_USAGE_MAX: 租户高使用率评分,默认-200
  • SCORE_PART_NUMBER_FIRST: 首个分卷作业评分,默认1
  • SCORE_PART_NUMBER_LAST: 最后分卷作业评分,默认0
  • SCORE_PART_NUMBER_LAST_REFERENCE: 分卷参考值,默认100
异步处理配置
  • ASYNC_PROCESSOR_POLL_INTERVAL_MS: 异步处理器轮询间隔(毫秒),默认5000
  • ASYNC_PROCESSOR_MAX_WORKERS_COUNT: 异步处理器最大工作线程数,默认1
Docker Compose示例
yaml
version: '3'
services:
  mod-data-import:
    image: folio/mod-data-import
    ports:
      - "8081:8081"
    environment:
      - DB_HOST=postgres
      - DB_PORT=5432
      - DB_NAME=folio_mod_data_import
      - DB_USER=folio
      - DB_PASSWORD=folio123
      - KAFKA_HOST=kafka
      - KAFKA_PORT=9092
      - AWS_URL=[***]
      - AWS_BUCKET=folio-imports
      - AWS_ACCESS_KEY_ID=minio_access_key
      - AWS_SECRET_ACCESS_KEY=minio_secret_key
      - AWS_SDK=false
      - SPLIT_FILES_ENABLED=true
      - RECORDS_PER_SPLIT_FILE=2000
    depends_on:
      - postgres
      - kafka
      - minio
查看更多 mod-data-import 相关镜像 →
folioci/mod-data-import logo
folioci/mod-data-import
by folioci
FOLIO项目的mod-data-import模块,用于数据导入处理,支持数据库连接,集成Kafka和AWS S3,提供文件拆分、异步处理及作业评分功能,适用于FOLIO生态系统的数据导入场景。
100K+ pulls
上次更新:27 天前
netdata/netdata logo
netdata/netdata
by Netdata
认证
这是Netdata的官方镜像,专门用于监控系统、容器及应用程序;作为一款开源实时监控工具,它可提供全面的性能数据采集与分析功能,支持对服务器资源占用、容器运行状态、应用程序响应速度等多维度指标进行实时追踪,帮助用户直观掌握系统运行状况,快速定位并解决潜在问题,适用于各类IT环境的监控需求,确保业务稳定高效运行。
563500M+ pulls
上次更新:1 天前
datadog/agent logo
datadog/agent
by Datadog
认证
新Datadog Agent的Docker容器,用于运行该代理以收集、处理并发送监控数据至Datadog平台。
1721B+ pulls
上次更新:3 天前
datadog/datadog-agent-runner-circle logo
datadog/datadog-agent-runner-circle
by Datadog
认证
该镜像是已弃用的Docker镜像,不再维护,已由datadog/agent-buildimages-circleci-runner替代。
500K+ pulls
上次更新:2 年前
datadog/docker-dd-agent logo
datadog/docker-dd-agent
by Datadog
认证
Datadog Agent的Docker容器,用于收集、聚合系统及应用程序性能数据并发送至Datadog平台,实现监控与分析。
99100M+ pulls
上次更新:5 年前
datadog/fake-datadog logo
datadog/fake-datadog
by Datadog
认证
此镜像对应的仓库已弃用。
50K+ pulls
上次更新:3 年前

轩辕镜像配置手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

登录仓库拉取

通过 Docker 登录认证访问私有仓库

Linux

在 Linux 系统配置镜像服务

Windows/Mac

在 Docker Desktop 配置镜像

Docker Compose

Docker Compose 项目配置

K8s Containerd

Kubernetes 集群配置 Containerd

K3s

K3s 轻量级 Kubernetes 镜像加速

宝塔面板

在宝塔面板一键配置镜像

群晖

Synology 群晖 NAS 配置

飞牛

飞牛 fnOS 系统配置镜像

极空间

极空间 NAS 系统配置服务

爱快路由

爱快 iKuai 路由系统配置

绿联

绿联 NAS 系统配置镜像

威联通

QNAP 威联通 NAS 配置

Podman

Podman 容器引擎配置

Singularity/Apptainer

HPC 科学计算容器配置

其他仓库配置

ghcr、Quay、nvcr 等镜像仓库

专属域名拉取

无需登录使用专属域名

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像支持哪些镜像仓库?

专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

oldzhang的头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
folioorg/mod-data-import
官方博客Docker 镜像使用技巧与技术博客
热门镜像查看热门 Docker 镜像推荐
一键安装一键安装 Docker 并配置镜像源
提交工单
咨询镜像拉取问题请 提交工单,官方技术交流群:13763429
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
咨询镜像拉取问题请提交工单,官方技术交流群:
轩辕镜像面向开发者与科研用户,提供开源镜像的搜索和访问支持。所有镜像均来源于原始仓库,本站不存储、不修改、不传播任何镜像内容。
官方邮箱:点击复制邮箱
©2024-2026 源码跳动
官方邮箱:点击复制邮箱Copyright © 2024-2026 杭州源码跳动科技有限公司. All rights reserved.
轩辕镜像 官方专业版 Logo
轩辕镜像轩辕镜像官方专业版
首页个人中心搜索镜像

交易
充值流量我的订单
工具
提交工单镜像收录一键安装
Npm 源Pip 源Homebrew 源
帮助
常见问题
其他
关于我们网站地图

官方QQ群: 13763429