Spaces:

tregu0458
/

pdf_2_dify_workflow

Sleeping

File size: 13,124 Bytes

{
  "nbformat": 4,
  "nbformat_minor": 0,
  "metadata": {
    "colab": {
      "provenance": []
    },
    "kernelspec": {
      "name": "python3",
      "display_name": "Python 3"
    },
    "language_info": {
      "name": "python"
    }
  },
  "cells": [
    {
      "cell_type": "code",
      "execution_count": null,
      "metadata": {
        "id": "2RCxpRzpqPrB"
      },
      "outputs": [],
      "source": [
        "!pip install gradio unstructured[pdf] langchain-community\n",
        "!pip install youtube-transcript-api pytube"
      ]
    },
    {
      "cell_type": "code",
      "source": [
        "import getpass\n",
        "\n",
        "DIFY_BASE_URL = getpass.getpass(\"DIFY_BASE_URL:\")\n",
        "DIFY_API_KEY_MYWORKFLOW = getpass.getpass(\"DIFY_API_KEY_MYWORKFLOW: \")\n",
        "\n"
      ],
      "metadata": {
        "id": "iDbRDVzHqZh8"
      },
      "execution_count": null,
      "outputs": []
    },
    {
      "cell_type": "code",
      "source": [
        "import gradio as gr\n",
        "import requests\n",
        "from langchain_community.document_loaders import YoutubeLoader, UnstructuredPDFLoader, WebBaseLoader\n",
        "from langchain_community.document_loaders import OnlinePDFLoader\n",
        "import json\n",
        "\n",
        "def run_workflow(message,language='en'):\n",
        "    try:\n",
        "        if not message.get('text',''):\n",
        "            file = message['files'][0]\n",
        "            # PDFファイルをロードしてテキストを抽出\n",
        "            loader = UnstructuredPDFLoader(file)\n",
        "            data = loader.load()\n",
        "            raw_text = data[0].page_content\n",
        "        else:\n",
        "          text_message = message.get('text','')\n",
        "          if \"youtube.com\" in text_message or \"youtu.be\" in text_message:\n",
        "              # YouTubeの場合\n",
        "              loader = YoutubeLoader.from_youtube_url(\n",
        "                  youtube_url=text_message,\n",
        "                  add_video_info=True,\n",
        "                  language=[language],\n",
        "              )\n",
        "              docs = loader.load()\n",
        "              raw_text = str(docs)\n",
        "          elif text_message.endswith(\".pdf\"):\n",
        "              # PDFの場合\n",
        "              loader = OnlinePDFLoader(text_message)\n",
        "              docs = loader.load()\n",
        "              raw_text = docs[0].page_content\n",
        "          else:\n",
        "              # それ以外の場合\n",
        "              loader = WebBaseLoader(text_message)\n",
        "              docs = loader.load()\n",
        "              raw_text = docs[0].page_content\n",
        "\n",
        "\n",
        "        # APIリクエストのための入力データを準備\n",
        "        inputs = {\n",
        "            \"knowledge\": raw_text\n",
        "        }\n",
        "\n",
        "        yield raw_text, \"loading...\", {}\n",
        "\n",
        "        # APIエンドポイントURL\n",
        "        url = DIFY_BASE_URL + \"/workflows/run\"\n",
        "\n",
        "        # APIリクエストのヘッダー\n",
        "        headers = {\n",
        "            \"Content-Type\": \"application/json\",\n",
        "            \"Authorization\": f\"Bearer {DIFY_API_KEY_MYWORKFLOW}\"\n",
        "        }\n",
        "\n",
        "        # APIリクエストのデータ\n",
        "        data = {\n",
        "            \"inputs\": inputs,\n",
        "            \"query\": \"\",\n",
        "            \"response_mode\": \"streaming\",\n",
        "            \"user\": \"abc_123\",\n",
        "        }\n",
        "\n",
        "        # APIにリクエストを送信\n",
        "        response = requests.post(url, headers=headers, json=data, stream=True)\n",
        "        response.raise_for_status()\n",
        "\n",
        "        assistant_message = \"\"\n",
        "        outputs = {}\n",
        "\n",
        "        # APIレスポンスのチャンク処理\n",
        "        for chunk in response.iter_lines(delimiter=b\"\\n\\n\"):\n",
        "            if chunk:\n",
        "                chunk_data = chunk.decode(\"utf-8\").strip()\n",
        "                if chunk_data.startswith(\"data:\"):\n",
        "                    json_data = chunk_data[6:]  # \"data: \"を取り除く\n",
        "                    if json_data:\n",
        "                        result = json.loads(json_data)\n",
        "                        if result.get(\"event\") == \"text_chunk\":\n",
        "                            answer = result.get(\"data\", \"\").get(\"text\", \"\")\n",
        "                            assistant_message += str(answer)\n",
        "                            yield raw_text, assistant_message, result.get(\"data\", \"\")\n",
        "                        elif result.get(\"event\") == \"workflow_finished\":\n",
        "                            outputs = result.get('data', \"\")\n",
        "                            yield raw_text, assistant_message, outputs\n",
        "\n",
        "    except Exception as e:\n",
        "        error_message = str(e)\n",
        "        print(f\"Error: {error_message}\")\n",
        "        return \"error\", error_message, {}\n",
        "\n",
        "# Gradioインターフェイスの設定\n",
        "iface = gr.Interface(\n",
        "    fn=run_workflow,\n",
        "    inputs=[gr.MultimodalTextbox(label=\"PDFファイルをアップロード\", file_types=[\".pdf\"], interactive=True),\n",
        "            gr.Dropdown(label=\"Language\",value=\"ja\",choices=[\"en\",\"en-US\", \"ja\", \"fr\",\"de\",\"it\"],allow_custom_value=True)],\n",
        "    outputs=[\n",
        "        gr.Textbox(label=\"生テキスト\", show_copy_button=True, max_lines=5),\n",
        "        gr.Markdown(),\n",
        "        gr.JSON()\n",
        "    ],\n",
        "    title=\"Documnet to Dify Workflow\",\n",
        "    description=\"このGradioインターフェイスでは、PDFファイル、YouTube動画、Webページを入力として受け取り、Dify APIワークフローを使用して処理することができます。\",\n",
        "    article=\"\"\"\n",
        "\n",
        "    © 2024 @tregu0458. All rights reserved.\n",
        "\n",
        "# PDF、YouTube、Web URLを入力としたDifyワークフロー\n",
        "\n",
        "このGradioインターフェイスでは、PDFファイル、YouTube動画、Webページを入力として受け取り、Dify APIワークフローを使用して処理することができます。PDFファイルをアップロードするか、YouTube URLを提供するか、Web URLを入力するだけで、ワークフローがテキストコンテンツを抽出し、Dify APIを使用して処理します。\n",
        "\n",
        "## 特徴\n",
        "- PDFファイル、YouTube動画、Webページを入力として対応\n",
        "- `langchain_community.document_loaders`の`UnstructuredPDFLoader`と`OnlinePDFLoader`を使用してPDFファイルからテキストを抽出\n",
        "- `langchain_community.document_loaders`の`YoutubeLoader`を使用してYouTube動画からテキストを抽出\n",
        "- `langchain_community.document_loaders`の`WebBaseLoader`を使用してWebページからテキストを抽出\n",
        "- 抽出されたテキストをDify APIワークフローで処理\n",
        "- リアルタイム更新のためのストリーミングレスポンス処理\n",
        "- 生テキスト、処理されたテキスト、JSON出力の表示\n",
        "\n",
        "## 使用方法\n",
        "1. 入力フィールドにPDFファイルをアップロードするか、YouTube URLを提供するか、Web URLを入力します。\n",
        "2. ドロップダウンから希望の言語を選択します（デフォルトは \"ja\"）。\n",
        "3. \"Submit\"ボタンをクリックして処理を開始します。\n",
        "4. インターフェイスには、入力から抽出された生テキスト、Dify APIから処理されたテキスト、JSON出力が表示されます。\n",
        "\n",
        "## 使用コンポーネント\n",
        "- Dify API\n",
        "- Gradio\n",
        "- langchain_community.document_loaders\n",
        "\n",
        "## ワークフローの仕様\n",
        "### 入力\n",
        "- Knowledge\n",
        "### 出力\n",
        "- Result\n",
        "- Raw Content\n",
        "### LLM\n",
        "- gemini-1.5-flash-latest\n",
        "\n",
        "## 注意事項\n",
        "- 処理は非同期的に実行され、ワークフローの進行に合わせてリアルタイムで結果が表示されます。\n",
        "- `yield`文を使用して、処理の途中経過を表示しながら、最終的な結果を返します。\n",
        "- エラー処理は、処理中に発生する可能性のある例外をキャッチして表示するように実装されています。\n",
        "`run_workflow`関数は、入力メッセージを受け取り、指定された言語でDify APIワークフローを使用して処理を実行します。関数内では、入力タイプ（PDFファイル、YouTube URL、Web URL）に応じて適切なローダーを使用してテキストを抽出し、Dify APIにリクエストを送信して処理を行います。処理の進行状況に応じて、`yield`文を使用して中間結果を表示し、最終的な結果を返します。エラーが発生した場合は、例外をキャッチして適切なエラーメッセージを表示します。\n",
        "    \"\"\"\n",
        ")\n",
        "\n",
        "if __name__ == \"__main__\":\n",
        "    iface.queue().launch()"
      ],
      "metadata": {
        "id": "yx9f1RwJtFi9"
      },
      "execution_count": null,
      "outputs": []
    },
    {
      "cell_type": "markdown",
      "source": [
        "# 利用規約\n",
        "\n",
        "本利用規約（以下、「本規約」といいます。）は、@tregu0458(以下、「私」といいます。)が提供するWebアプリケーション「tregu0458/document_2_dify_workflow」（以下、「本スクリプト」といいます。）の利用に関する条件を定めるものです。ユーザーは、本スクリプトを利用することにより、本規約に同意したものとみなされます。\n",
        "\n",
        "## 1. ライセンス\n",
        "\n",
        "1.1 本スクリプトは、商用・非商用を問わず利用することができます。\n",
        "\n",
        "1.2 本スクリプトは、複製、継承、改変することができます。\n",
        "\n",
        "1.3 本スクリプト、および複製、継承、改変したものを有償で再配布もしくは販売を行う場合は、事前に私にご相談ください。[X @ tregu0458](https://twitter.com/tregu0458)\n",
        "\n",
        "1.4 本スクリプトの利用にあたり、クレジットの表示は必須ではありません。ただし、\"@tregu0458\"の表示は、私の励みになります。\n",
        "\n",
        "## 2. 免責事項\n",
        "\n",
        "2.1 私は、本スクリプトの内容、情報の正確性、完全性、有用性、最新性、信頼性、安全性等について、いかなる保証も行いません。\n",
        "\n",
        "2.2 私は、ユーザーが本スクリプトを利用したことに起因して生じた損害について、一切の責任を負いません。\n",
        "\n",
        "## 3. 利用規約の変更\n",
        "\n",
        "私は、必要に応じて、本規約を変更することがあります。変更後の本規約は、本スクリプト上に表示された時点から効力を生じるものとします。\n",
        "\n",
        "## 4. 準拠法と管轄裁判所\n",
        "\n",
        "本規約は、日本法に準拠するものとします。本スクリプトに関して紛争が生じた場合は、[管轄裁判所]を第一審の専属的合意管轄裁判所とします。\n",
        "\n",
        "以上\n",
        "\n",
        "---\n",
        "## OK例(相談不要)\n",
        "1. 個人の勉強用に利用\n",
        "   - 学生が本スクリプトを参考に、youtube要約ワークフロー作成。\n",
        "\n",
        "2. 改変して無償公開\n",
        "   - エンジニアが本スクリプトを改変し、新機能を追加。Huggingface Spaceにデプロイし、MITラインセンスにて公開。\n",
        "\n",
        "3. 社内ツールとして利用\n",
        "   - 企業が業務効率化のため、本スクリプトを社内ツールに組み込んで使用。\n"
      ],
      "metadata": {
        "id": "8bbAxlNBMn4d"
      }
    }
  ]
}