Spaces:

TIGER-Lab
/

GenAI-Arena

Running on Zero

App Files Files Community

DongfuJiang commited on Aug 21

Commit

45557a3

•

2 Parent(s): cf709ea 8d4ac15

Merge branch 'main' of https://huggingface.co/spaces/TIGER-Lab/GenAI-Arena

Browse files

Files changed (3) hide show

model/model_manager.py +61 -1
model/profanity_words.txt +130 -0
serve/leaderboard.py +2 -12

model/model_manager.py CHANGED Viewed

@@ -10,6 +10,7 @@ from .fetch_museum_results import draw_from_imagen_museum, draw2_from_imagen_mus
 from .pre_download import pre_download_all_models, pre_download_video_models
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 def debug_packages():
     import pkg_resources
@@ -17,7 +18,59 @@ def debug_packages():
     installed_packages = pkg_resources.working_set
     for package in installed_packages:
         print(f"{package.key}=={package.version}")
 class ModelManager:
     def __init__(self, enable_nsfw=False, do_pre_download=False, do_debug_packages=False):
         self.model_ig_list = IMAGE_GENERATION_MODELS
@@ -52,6 +105,13 @@ class ModelManager:
         else:
             self.guard_tokenizer = None
             self.guard = None
     def NSFW_filter(self, prompt):
         chat = [{"role": "user", "content": prompt}]

 from .pre_download import pre_download_all_models, pre_download_video_models
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
+import re
 def debug_packages():
     import pkg_resources
     installed_packages = pkg_resources.working_set
     for package in installed_packages:
         print(f"{package.key}=={package.version}")
+def fetch_unsafe_words(file_path):
+    """
+    Loads unsafe words from a file and returns them as a list.
+    """
+    try:
+        with open(file_path, 'r') as file:
+            # Read lines from file and strip any extra whitespace
+            unsafe_words = [line.strip() for line in file.readlines()]
+            # Remove any empty strings that may result from empty lines
+            unsafe_words = [word for word in unsafe_words if word]
+            return unsafe_words
+    except Exception as e:
+        print(f"Error loading file: {e}. Using default unsafe words.")
+        # Default unsafe words list
+        return [
+            "anal", "anus", "arse", "ass", "ballsack", "bastard", "bdsm", "bitch", "bimbo",
+            "blow job", "blowjob", "blue waffle", "boob", "booobs", "breasts", "booty call",
+            "boner", "bondage", "bullshit", "busty", "butthole", "cawk", "chink", "clit",
+            "cnut", "cock", "cokmuncher", "cowgirl", "crap", "crotch", "cum", "cunt", "damn",
+            "dick", "dildo", "dink", "deepthroat", "deep throat", "dog style", "doggie style",
+            "doggy style", "doosh", "douche", "duche", "ejaculate", "ejaculating",
+            "ejaculation", "ejakulate", "erotic", "erotism", "fag", "fatass", "femdom",
+            "fingering", "footjob", "foot job", "fuck", "fcuk", "fingerfuck", "fistfuck",
+            "fook", "fooker", "fuk", "gangbang", "gang bang", "gaysex", "handjob",
+            "hand job", "hentai", "hooker", "hoer", "homo", "horny", "incest", "jackoff",
+            "jack off", "jerkoff", "jerk off", "jizz", "masturbate", "mofo", "mothafuck",
+            "motherfuck", "milf", "muff", "nigga", "nigger", "nipple", "nob", "numbnuts",
+            "nutsack", "nude", "orgy", "orgasm", "panty", "panties", "penis", "playboy",
+            "porn", "pussy", "pussies", "rape", "raping", "rapist", "rectum", "retard",
+            "rimming", "sadist", "sadism", "scrotum", "sex", "semen", "shemale", "she male",
+            "shit", "slut", "spunk", "strip club", "stripclub", "tit", "threesome",
+            "three some", "throating", "twat", "viagra", "vagina", "wank", "whore", "whoar",
+            "xxx"
+        ]
+def check_prompt_safety(prompt, unsafe_words_file='./profanity_words.txt'):
+    """
+    Checking prompt safety. Returns boolean (Not Safe = False, Safe = True)
+    """
+    # Load unsafe words from the provided file or use default if loading fails
+    unsafe_words = fetch_unsafe_words(unsafe_words_file)
+    # Convert input string to lowercase to ensure case-insensitive matching
+    prompt = prompt.lower()
+    # Check if any unsafe word is in the input string
+    for word in unsafe_words:
+        # Use regex to match whole words only
+        if re.search(r'\b' + re.escape(word) + r'\b', prompt):
+            return False
+    return True
 class ModelManager:
     def __init__(self, enable_nsfw=False, do_pre_download=False, do_debug_packages=False):
         self.model_ig_list = IMAGE_GENERATION_MODELS
         else:
             self.guard_tokenizer = None
             self.guard = None
+    def NSFW_filter_simple(self, prompt):
+        is_safe = check_prompt_safety(prompt)
+        if is_safe:
+            return "safe"
+        else:
+            return "unsafe"
     def NSFW_filter(self, prompt):
         chat = [{"role": "user", "content": prompt}]

model/profanity_words.txt ADDED Viewed

	@@ -0,0 +1,130 @@

+anal
+anus
+arse
+ass
+ballsack
+bastard
+bdsm
+bitch
+bimbo
+blow job
+blowjob
+blue waffle
+boob
+booobs
+breasts
+booty call
+boner
+bondage
+bullshit
+busty
+butthole
+cawk
+chink
+clit
+cnut
+cock
+cokmuncher
+cowgirl
+crap
+crotch
+cum
+cunt
+damn
+dick
+dildo
+dink
+deepthroat
+deep throat
+dog style
+doggie style
+doggy style
+doosh
+douche
+duche
+ejaculate
+ejaculating
+ejaculation
+ejakulate
+erotic
+erotism
+fag
+fatass
+femdom
+fingering
+footjob
+foot job
+fuck
+fcuk
+fingerfuck
+fistfuck
+fook
+fooker
+fuk
+gangbang
+gang bang
+gaysex
+handjob
+hand job
+hentai
+hooker
+hoer
+homo
+horny
+incest
+jackoff
+jack off
+jerkoff
+jerk off
+jizz
+masturbate
+mofo
+mothafuck
+motherfuck
+milf
+muff
+nigga
+nigger
+nipple
+nob
+numbnuts
+nutsack
+nude
+orgy
+orgasm
+panty
+panties
+penis
+playboy
+porn
+pussy
+pussies
+rape
+raping
+rapist
+rectum
+retard
+rimming
+sadist
+sadism
+scrotum
+sex
+semen
+shemale
+she male
+shit
+slut
+spunk
+strip club
+stripclub
+tit
+threesome
+three some
+throating
+twat
+viagra
+vagina
+wank
+whore
+whoar
+xxx

serve/leaderboard.py CHANGED Viewed

@@ -49,13 +49,6 @@ def load_leaderboard_table_csv(filename, add_hyperlink=True):
     for col in df.columns:
         if "Arena Elo rating" in col:
             df[col] = df[col].apply(lambda x: int(x) if x != "-" else np.nan)
-        elif col == "MMLU":
-            df[col] = df[col].apply(lambda x: round(x * 100, 1) if x != "-" else np.nan)
-        elif col == "MT-bench (win rate %)":
-            df[col] = df[col].apply(lambda x: round(x, 1) if x != "-" else np.nan)
-        elif col == "MT-bench (score)":
-            df[col] = df[col].apply(lambda x: round(x, 2) if x != "-" else np.nan)
         if add_hyperlink and col == "Model":
             df[col] = df.apply(lambda row: model_hyperlink(row[col], row["Link"]), axis=1)
     return df
@@ -111,9 +104,6 @@ def get_full_table(anony_arena_df, full_arena_df, model_table_df):
             row.append(np.nan)
             row.append("N/A")
             row.append(np.nan)
-        # row.append(model_table_df.iloc[i]["MT-bench (score)"])
-        # row.append(model_table_df.iloc[i]["Num Battles"])
-        # row.append(model_table_df.iloc[i]["MMLU"])
         # Organization
         row.append(model_table_df.iloc[i]["Organization"])
         # license
@@ -244,7 +234,7 @@ def build_leaderboard_tab(elo_results_file, leaderboard_table_file, show_plot=Tr
                     value=arena_table_vals,
                     elem_id="arena_leaderboard_dataframe",
                     height=700,
-                    column_widths=[30, 50, 30, 30, 30, 70, 150],
                     wrap=True,
                 )
             with gr.Tab("Full Leaderboard", id=1):
@@ -266,7 +256,7 @@ def build_leaderboard_tab(elo_results_file, leaderboard_table_file, show_plot=Tr
                     datatype=["str", "markdown", "number", "str", "number", "str", "number", "str", "str"],
                     value=full_table_vals,
                     elem_id="full_leaderboard_dataframe",
-                    column_widths=[30, 50, 30, 30, 30, 30, 30, 70, 150],
                     height=700,
                     wrap=True,
                 )

     for col in df.columns:
         if "Arena Elo rating" in col:
             df[col] = df[col].apply(lambda x: int(x) if x != "-" else np.nan)
         if add_hyperlink and col == "Model":
             df[col] = df.apply(lambda row: model_hyperlink(row[col], row["Link"]), axis=1)
     return df
             row.append(np.nan)
             row.append("N/A")
             row.append(np.nan)
         # Organization
         row.append(model_table_df.iloc[i]["Organization"])
         # license
                     value=arena_table_vals,
                     elem_id="arena_leaderboard_dataframe",
                     height=700,
+                    column_widths=[30, 70, 30, 30, 30, 70, 100],
                     wrap=True,
                 )
             with gr.Tab("Full Leaderboard", id=1):
                     datatype=["str", "markdown", "number", "str", "number", "str", "number", "str", "str"],
                     value=full_table_vals,
                     elem_id="full_leaderboard_dataframe",
+                    column_widths=[30, 70, 30, 30, 30, 30, 30, 70, 100],
                     height=700,
                     wrap=True,
                 )