您好, 欢迎来到 !    登录 | 注册 | | 设为首页 | 收藏本站

Python Airflow-从PythonOperator返回结果

Python Airflow-从PythonOperator返回结果

您可能想查看Airflow的XCOM:https ://airflow.apache.org/concepts.html#xcoms

如果从函数返回值,则此值存储在xcom中。就您而言,您可以像从其他Python代码一样访问它:

task_instance = kwargs['task_instance']
task_instance.xcom_pull(task_ids='Task1')

或像这样的模板中:

{{ task_instance.xcom_pull(task_ids='Task1') }}

如果要指定键,可以将其推入XCOM(在任务内):

task_instance = kwargs['task_instance']
task_instance.xcom_push(key='the_key', value=my_str)

然后,您可以像下面这样访问它:

task_instance.xcom_pull(task_ids='my_task', key='the_key')

后续问题: 我不能在其他函数中使用该值,而是将其传递给另一个PythonOperator,例如-“ t2 =” BashOperator(task_id =’Moving_bucket’,bash_command =’python /home/raw.py“%s” ‘%file_name,dag = dag)“-我想访问“ Task1”返回的file_name。如何实现?

首先,在我看来,该值实际上 不是 传递给另一个PythonOperator而是传递给BashOperator

其次,这已经在我上面的回答中涵盖了。该字段bash_command是模板化的(请参阅template_fields代码https ://github.com/apache/incubator- airflow/blob/master/airflow/operators/bash_operator.py)。因此,我们可以使用模板版本:

BashOperator(
  task_id='Moving_bucket', 
  bash_command='python /home/raw.py {{ task_instance.xcom_pull(task_ids='Task1') }} ',
  dag=dag,
)

说明:Airflow的工作方式如下:它将执行Task1,然后填充xcom,然后执行一个任务。因此,为使您的示例正常工作,您需要先执行Task1,然后在Task1的下游执行Moving_bucket。

由于您使用的是返回函数,因此您也可以省略key='file'fromxcom_pull而不是在函数中手动设置它。

python 2022/1/1 18:35:31 有244人围观

撰写回答


你尚未登录,登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进,让解决方法与时俱进

请先登录

推荐问题


联系我
置顶