gitlab-org--gitlab-foss/lib/bulk_imports/pipeline.rb

# frozen_string_literal: true

module BulkImports
  module Pipeline
    extend ActiveSupport::Concern
    include Gitlab::Utils::StrongMemoize
    include Gitlab::ClassAttributes
    include Runner

    NotAllowedError = Class.new(StandardError)
    ExpiredError = Class.new(StandardError)
    FailedError = Class.new(StandardError)

    CACHE_KEY_EXPIRATION = 2.hours
    NDJSON_EXPORT_TIMEOUT = 30.minutes

    def initialize(context)
      @context = context
    end

    def tracker
      @tracker ||= context.tracker
    end

    def portable
      @portable ||= context.portable
    end

    def import_export_config
      @import_export_config ||= context.import_export_config
    end

    def current_user
      @current_user ||= context.current_user
    end

    included do
      private

      attr_reader :context

      # Fetch pipeline extractor.
      # An extractor is defined either by instance `#extract(context)` method
      # or by using `extractor` DSL.
      #
      # @example
      # class MyPipeline
      #   extractor MyExtractor, foo: :bar
      # end
      #
      # class MyPipeline
      #   def extract(context)
      #     puts 'Fetch some data'
      #   end
      # end
      #
      # If pipeline implements instance method `extract` - use it
      # and ignore class `extractor` method implementation.
      def extractor
        @extractor ||= self.respond_to?(:extract) ? self : instantiate(self.class.get_extractor)
      end

      # Fetch pipeline transformers.
      #
      # A transformer can be defined using:
      #   - `transformer` class method
      #   - `transform` instance method
      #
      # Multiple transformers can be defined within a single
      # pipeline and run sequentially for each record in the
      # following order:
      #   - Instance method `transform`
      #   - Transformers defined using `transformer` class method
      #
      # Instance method `transform` is always the last to run.
      #
      # @example
      # class MyPipeline
      #   transformer MyTransformerOne, foo: :bar
      #   transformer MyTransformerTwo, foo: :bar
      #
      #   def transform(context, data)
      #     # perform transformation here
      #   end
      # end
      #
      # In the example above `#transform` is the first to run and
      # `MyTransformerTwo` method is the last.
      def transformers
        strong_memoize(:transformers) do
          defined_transformers = self.class.transformers.map(&method(:instantiate))

          transformers = []
          transformers << self if respond_to?(:transform)
          transformers.concat(defined_transformers)
          transformers
        end
      end

      # Fetch pipeline loader.
      # A loader is defined either by instance method `#load(context, data)`
      # or by using `loader` DSL.
      #
      # @example
      # class MyPipeline
      #   loader MyLoader, foo: :bar
      # end
      #
      # class MyPipeline
      #   def load(context, data)
      #     puts 'Load some data'
      #   end
      # end
      #
      # If pipeline implements instance method `load` - use it
      # and ignore class `loader` method implementation.
      def loader
        @loader ||= self.respond_to?(:load) ? self : instantiate(self.class.get_loader)
      end

      def pipeline
        @pipeline ||= self.class.name
      end

      def instantiate(class_config)
        options = class_config[:options]

        if options
          class_config[:klass].new(**class_config[:options])
        else
          class_config[:klass].new
        end
      end

      def abort_on_failure?
        self.class.abort_on_failure?
      end
    end

    class_methods do
      def extractor(klass, options = nil)
        class_attributes[:extractor] = { klass: klass, options: options }
      end

      def transformer(klass, options = nil)
        add_attribute(:transformers, klass, options)
      end

      def loader(klass, options = nil)
        class_attributes[:loader] = { klass: klass, options: options }
      end

      def get_extractor
        class_attributes[:extractor]
      end

      def transformers
        class_attributes[:transformers] || []
      end

      def get_loader
        class_attributes[:loader]
      end

      def abort_on_failure!
        class_attributes[:abort_on_failure] = true
      end

      def abort_on_failure?
        class_attributes[:abort_on_failure]
      end

      def ndjson_pipeline!
        class_attributes[:ndjson_pipeline] = true
      end

      def ndjson_pipeline?
        class_attributes[:ndjson_pipeline]
      end

      def relation_name(name)
        class_attributes[:relation_name] = name
      end

      def relation
        class_attributes[:relation_name]
      end

      private

      def add_attribute(sym, klass, options)
        class_attributes[sym] ||= []
        class_attributes[sym] << { klass: klass, options: options }
      end
    end
  end
end
Add latest changes from gitlab-org/gitlab@master 2020-10-23 11:08:42 -04:00			`# frozen_string_literal: true`

			`module BulkImports`
			`module Pipeline`
			`extend ActiveSupport::Concern`
Add latest changes from gitlab-org/gitlab@master 2021-02-22 13:10:55 -05:00			`include Gitlab::Utils::StrongMemoize`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`include Gitlab::ClassAttributes`
Add latest changes from gitlab-org/gitlab@master 2021-02-12 13:08:59 -05:00			`include Runner`
Add latest changes from gitlab-org/gitlab@master 2020-10-23 11:08:42 -04:00
Add latest changes from gitlab-org/gitlab@master 2021-03-01 13:11:21 -05:00			`NotAllowedError = Class.new(StandardError)`
Add latest changes from gitlab-org/gitlab@master 2021-05-27 14:10:52 -04:00			`ExpiredError = Class.new(StandardError)`
			`FailedError = Class.new(StandardError)`
Add latest changes from gitlab-org/gitlab@master 2021-03-01 13:11:21 -05:00
Add latest changes from gitlab-org/gitlab@master 2021-03-02 10:10:57 -05:00			`CACHE_KEY_EXPIRATION = 2.hours`
Add latest changes from gitlab-org/gitlab@master 2021-05-27 14:10:52 -04:00			`NDJSON_EXPORT_TIMEOUT = 30.minutes`
Add latest changes from gitlab-org/gitlab@master 2021-03-02 10:10:57 -05:00
Add latest changes from gitlab-org/gitlab@master 2021-02-12 13:08:59 -05:00			`def initialize(context)`
			`@context = context`
			`end`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00
Add latest changes from gitlab-org/gitlab@master 2021-03-18 11:09:04 -04:00			`def tracker`
			`@tracker \|\|= context.tracker`
			`end`

Add latest changes from gitlab-org/gitlab@master 2021-05-27 14:10:52 -04:00			`def portable`
			`@portable \|\|= context.portable`
			`end`

			`def import_export_config`
			`@import_export_config \|\|= context.import_export_config`
			`end`

Add latest changes from gitlab-org/gitlab@master 2021-06-02 14:10:01 -04:00			`def current_user`
			`@current_user \|\|= context.current_user`
			`end`

Add latest changes from gitlab-org/gitlab@master 2021-02-12 13:08:59 -05:00			`included do`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`private`

Add latest changes from gitlab-org/gitlab@master 2021-02-12 13:08:59 -05:00			`attr_reader :context`

Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`# Fetch pipeline extractor.`
			# An extractor is defined either by instance `#extract(context)` method
			# or by using `extractor` DSL.
			`#`
			`# @example`
			`# class MyPipeline`
			`# extractor MyExtractor, foo: :bar`
			`# end`
			`#`
			`# class MyPipeline`
			`# def extract(context)`
			`# puts 'Fetch some data'`
			`# end`
			`# end`
			`#`
			# If pipeline implements instance method `extract` - use it
			# and ignore class `extractor` method implementation.
Add latest changes from gitlab-org/gitlab@master 2021-01-12 01:10:31 -05:00			`def extractor`
Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`@extractor \|\|= self.respond_to?(:extract) ? self : instantiate(self.class.get_extractor)`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`# Fetch pipeline transformers.`
			`#`
			`# A transformer can be defined using:`
			# - `transformer` class method
			# - `transform` instance method
			`#`
			`# Multiple transformers can be defined within a single`
			`# pipeline and run sequentially for each record in the`
			`# following order:`
			# - Instance method `transform`
Add latest changes from gitlab-org/gitlab@master 2021-09-13 05:11:26 -04:00			# - Transformers defined using `transformer` class method
Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`#`
			# Instance method `transform` is always the last to run.
			`#`
			`# @example`
			`# class MyPipeline`
			`# transformer MyTransformerOne, foo: :bar`
			`# transformer MyTransformerTwo, foo: :bar`
			`#`
			`# def transform(context, data)`
			`# # perform transformation here`
			`# end`
			`# end`
			`#`
Add latest changes from gitlab-org/gitlab@master 2021-02-22 13:10:55 -05:00			# In the example above `#transform` is the first to run and
			# `MyTransformerTwo` method is the last.
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`def transformers`
Add latest changes from gitlab-org/gitlab@master 2021-02-22 13:10:55 -05:00			`strong_memoize(:transformers) do`
			`defined_transformers = self.class.transformers.map(&method(:instantiate))`

			`transformers = []`
			`transformers << self if respond_to?(:transform)`
			`transformers.concat(defined_transformers)`
			`transformers`
			`end`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`# Fetch pipeline loader.`
			# A loader is defined either by instance method `#load(context, data)`
			# or by using `loader` DSL.
			`#`
			`# @example`
			`# class MyPipeline`
			`# loader MyLoader, foo: :bar`
			`# end`
			`#`
			`# class MyPipeline`
			`# def load(context, data)`
			`# puts 'Load some data'`
			`# end`
			`# end`
			`#`
			# If pipeline implements instance method `load` - use it
			# and ignore class `loader` method implementation.
Add latest changes from gitlab-org/gitlab@master 2021-01-12 01:10:31 -05:00			`def loader`
Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`@loader \|\|= self.respond_to?(:load) ? self : instantiate(self.class.get_loader)`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

Add latest changes from gitlab-org/gitlab@master 2020-11-30 10:09:21 -05:00			`def pipeline`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`@pipeline \|\|= self.class.name`
			`end`

			`def instantiate(class_config)`
Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`options = class_config[:options]`

			`if options`
Add latest changes from gitlab-org/gitlab@master 2021-05-27 14:10:52 -04:00			`class_config[:klass].new(**class_config[:options])`
Add latest changes from gitlab-org/gitlab@master 2021-02-19 07:11:06 -05:00			`else`
			`class_config[:klass].new`
			`end`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`
Add latest changes from gitlab-org/gitlab@master 2020-11-30 10:09:21 -05:00
			`def abort_on_failure?`
			`self.class.abort_on_failure?`
			`end`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

			`class_methods do`
			`def extractor(klass, options = nil)`
Add latest changes from gitlab-org/gitlab@master 2021-01-12 01:10:31 -05:00			`class_attributes[:extractor] = { klass: klass, options: options }`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

			`def transformer(klass, options = nil)`
			`add_attribute(:transformers, klass, options)`
			`end`

			`def loader(klass, options = nil)`
Add latest changes from gitlab-org/gitlab@master 2021-01-12 01:10:31 -05:00			`class_attributes[:loader] = { klass: klass, options: options }`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

Add latest changes from gitlab-org/gitlab@master 2021-01-12 01:10:31 -05:00			`def get_extractor`
			`class_attributes[:extractor]`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

			`def transformers`
Add latest changes from gitlab-org/gitlab@master 2021-02-22 13:10:55 -05:00			`class_attributes[:transformers] \|\| []`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

Add latest changes from gitlab-org/gitlab@master 2021-01-12 01:10:31 -05:00			`def get_loader`
			`class_attributes[:loader]`
Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`end`

Add latest changes from gitlab-org/gitlab@master 2020-11-30 10:09:21 -05:00			`def abort_on_failure!`
			`class_attributes[:abort_on_failure] = true`
			`end`

			`def abort_on_failure?`
			`class_attributes[:abort_on_failure]`
			`end`

Add latest changes from gitlab-org/gitlab@master 2021-05-27 14:10:52 -04:00			`def ndjson_pipeline!`
			`class_attributes[:ndjson_pipeline] = true`
			`end`

			`def ndjson_pipeline?`
			`class_attributes[:ndjson_pipeline]`
			`end`

Add latest changes from gitlab-org/gitlab@master 2021-06-02 14:10:01 -04:00			`def relation_name(name)`
			`class_attributes[:relation_name] = name`
			`end`

			`def relation`
			`class_attributes[:relation_name]`
			`end`

Add latest changes from gitlab-org/gitlab@master 2020-11-20 04:09:06 -05:00			`private`

			`def add_attribute(sym, klass, options)`
			`class_attributes[sym] \|\|= []`
			`class_attributes[sym] << { klass: klass, options: options }`
			`end`
Add latest changes from gitlab-org/gitlab@master 2020-10-23 11:08:42 -04:00			`end`
			`end`
			`end`