File size: 10,036 Bytes
7245dc6
 
 
 
 
 
 
 
 
 
8525e66
 
7245dc6
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
from core.controllers.pages_controller import Page
from core.controllers.main_process import Generador


class Home(Page):
    variables_globales = {
        "prompt": "cat,fish,dog",
        "img_bytes": None,
        "img_src": None,
        "settings": {
            "model": str("CIDAS/clipseg-rd64-refined"),
            "tokenizer": str("CIDAS/clipseg-rd64-refined"),
        },
        "img_output": None,
        "predicciones": None,
        "fuentes": [
            {"titulo": "Papper",
             "url": "https://arxiv.org/abs/2112.10003"},
            {"titulo": "Transformers",
             "url": "https://huggingface.co/docs/transformers/v4.32.1/en/index"},
            {"titulo": "Modelo CIDAS/ClipSeg-rd64-refined",
             "url": "https://huggingface.co/CIDAS/clipseg-rd64-refined"},
            {"titulo": "Repositorio",
             "url": "https://huggingface.co/CIDAS/clipseg-rd64-refined"},
            {"titulo": "Material Apoyo",
             "url": "https://github.com/NielsRogge/Transformers-Tutorials/blob/master/CLIPSeg/Zero_shot_image_segmentation_with_CLIPSeg.ipynb"},
            {"titulo": "IO",
             "url": "https://pypi.org/project/io/"},
            {"titulo": "PIL",
             "url": "https://pypi.org/project/Pillow/"},
            {"titulo": "requests",
             "url": "https://pypi.org/project/requests/"},
            {"titulo": "timm",
             "url": "https://pypi.org/project/timm/"},
            {"titulo": "matplotlib",
             "url": "https://pypi.org/project/matplotlib/"}]
    }

    archivos_css = ["main",
                    "home"]

    def __init__(self, title=str("Bienvenido"), icon=str("🖼️"), init_page=False):
        super().__init__()
        if init_page:
            self.new_page(title=title,
                          icon=icon)
        self.init_globals(globals=self.variables_globales)
        for archivo in self.archivos_css:
            self.cargar_css(archivo_css=archivo)
        self.about()

    def about(self):
        self.builder().sidebar.markdown(unsafe_allow_html=False,
                                        help=None,
                                        body="""
                               ## Tema

                               La segmentación de imágenes es el proceso de dividir una imagen en segmentos o regiones significativas. 
                               
                               Puede ser de diferentes tipos, como la segmentación semántica (asignación de etiquetas de clase a píxeles) o la segmentación basada en contornos (división de una imagen en áreas definidas por bordes). 
                               
                               Esta técnica es ampliamente utilizada en visión por computadora para analizar y comprender imágenes.

                               ## Recursos
                               """)

        for fuente in self.get_global('fuentes'):
            self.builder().sidebar.markdown(
                unsafe_allow_html=False,
                help=None,
                body=f"""
                * **{fuente.get('titulo')}** - {fuente.get('url')}
                """
            )
        self.builder().sidebar.markdown(
            unsafe_allow_html=False,
            help=None,
            body="""
            ###### Es **importante** mencionar que esta **compilación** se encuentra en proceso de **construcción**.
            
            *Si deseas **participar**, eres **bienvenido** de aportar en el repositorio oficial:*
            
            https://github.com/coder160/cuadernos/
            """)

    def obtener_bytes(self, archivo):
        self.set_global(key='img_src',
                        value=archivo)

    def actualizar_modelo_tokenizer(self, modelo, tokenizer):
        self.set_global(key='settings',
                        value={'model': modelo,
                               'tokenizer': tokenizer})

    def procesar_imagen(self, prompt):
        proceso = Generador(configuraciones=self.get_global('settings'))
        proceso.generar_prediccion(
            imagen_bytes=self.imgg.open(
                self.get_global('img_src')).convert("RGB"),
            new_prompt=prompt
        )
        self.set_global(key='predicciones', value=proceso.prediccion)

    def expander_instrucciones(self, placeholder):
        instrucciones = placeholder.expander(expanded=False,
                                             label="Instrucciones")
        instrucciones.markdown(unsafe_allow_html=False,
                               help=None,
                               body="""
                               1.   **Cargue su Imagen Base**:

                               Elija cualquiera de las dos opciones para cargar su imagen:

                               *    **Desde su Galería**: cargue la imagen desde la galería de su teléfono o computadora.

                               *    **Desde su Cámara**: cargue la imagen directamente desde la cámara de su teléfono o computadora.


                               2.   **Detectar / Predecir**:

                               Realice la **detección de objetos** con base a las predicciones realizadas por el **modelo** pre-entrenado seleccionado.

                               A partir del dataset con el que fue pre-entrenado el modelo, tratará de predecir cuales son los objetos en la imagen cargada.


                               *    **Configuraciones Avanzadas**:

                               *Elija un modelo y procesador de la lista disponible, o elija uno directamente de la base de modelos disponible en HuggingFace.*
                               """)

    def expander_imagen_base(self, placeholder):
        imagen_base = placeholder.container()
        imagen_base.markdown(unsafe_allow_html=False,
                             help=None,
                             body="""
                             **Cargue su Imagen Base**:
                             """)
        archivo_expander = imagen_base.expander(expanded=False,
                                                label="Desde su Galería")
        _archivo = archivo_expander.file_uploader(label="Galería",
                                                  on_change=None,
                                                  accept_multiple_files=False,
                                                  label_visibility="visible")
        if (archivo_expander.button(label="Cargar Archivo", type="secondary", use_container_width=True,
                                    help="Suba un archivo.") and _archivo is not None):
            self.obtener_bytes(_archivo)

        camara_expander = imagen_base.expander(expanded=False,
                                               label="Desde su Cámara")
        _captura = camara_expander.camera_input(label="Cámara",
                                                on_change=None,
                                                label_visibility="visible")
        if (camara_expander.button(label="Cargar Captura", type="secondary", use_container_width=True,
                                   help="Tome una fotografía.") and _captura is not None):
            self.obtener_bytes(_captura)

    def expander_configuraciones(self, placeholder):
        configuraciones = placeholder.expander(
            expanded=False, label="Configuraciones Avanzadas")
        modelo = configuraciones.text_input(
            label="MODELO", on_change=None, label_visibility="visible",
            value=self.get_global('settings').get('model'))
        tokenizer = configuraciones.text_input(
            label="TOKENIZER", on_change=None, label_visibility="visible",
            value=self.get_global('settings').get('tokenizer'))

        if configuraciones.button(label="Configurar", type="secondary", use_container_width=True,
                                  help="Actualice configuraciones"):
            self.actualizar_modelo_tokenizer(modelo, tokenizer)

    def resultados(self, placeholder):
        resultados = placeholder.container()

        if self.get_global('img_src', None) is not None:
            resultados.image(
                image=self.get_global('img_src').getvalue(),
                caption="Su resultado",
                use_column_width="auto",
                channels="RGB",
                output_format="auto"
            )
            if self.get_global('predicciones', None) is not None:
                for i, predict in enumerate(self.get_global('predicciones', [])):
                    resultados.image(
                        image=predict,
                        caption=f"Su predicción {i}",
                        use_column_width="auto",
                        channels="RGB",
                        output_format="auto"
                    )

    def agregar_card_base(self, columna):
        card_principal = columna.container()

        columna_inputs, columna_outputs = card_principal.columns(
            [0.3, 0.7], gap="small")

        self.expander_instrucciones(columna_inputs)
        self.expander_imagen_base(columna_inputs)
        self.expander_configuraciones(columna_inputs)
        columna_inputs.markdown(unsafe_allow_html=False,
                                help=None,
                                body="""
                             **Introduzca palabras de búsqueda**:
                             """)
        prompt = columna_inputs.text_input(
            label="Prompt", on_change=None, label_visibility="visible",
            value=self.get_global('prompt'))
        if columna_inputs.button(label="Detectar / Predecir", help="Realizar Predicciones",
                                 type="secondary", use_container_width=True):
            self.procesar_imagen(prompt)
        self.resultados(columna_outputs)

    def build(self):

        columna_principal = self.get_body().columns(1, gap="small")[0]
        self.agregar_card_base(columna_principal)


if __name__ == "__main__":
    Home(init_page=True).build()