Spaces:

charlesapochi
/

plagiarism-detection-llm

Running

App Files Files Community

charlesapochi commited on Aug 14, 2024

Commit

b248ba6

1 Parent(s): 80b5673

model update

Browse files

Files changed (23) hide show

__pycache__/app.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/demo_watermark.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/extended_watermark_engine.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/extended_watermark_processor.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/extended_watermark_utils.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/watermark_demo.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/watermark_engine.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/watermark_processor.cpython-310.pyc +0 -0
{src → algorithm}/__pycache__/watermark_utils.cpython-310.pyc +0 -0
{src → algorithm}/extended_watermark_engine.py +0 -0
{src → algorithm}/watermark_engine.py +0 -0
app.py +254 -32
components/__pycache__/homoglyphs.cpython-310.pyc +0 -0
components/__pycache__/normalizers.cpython-310.pyc +0 -0
components/__pycache__/prf_schemes.cpython-310.pyc +0 -0
components/__pycache__/utils.cpython-310.pyc +0 -0
{data → components/data}/__init__.py +0 -0
{data → components/data}/categories.json +0 -0
{data → components/data}/confusables.json +0 -0
{data → components/data}/languages.json +0 -0
components/utils.py +32 -0
src/watermark_demo.py +0 -291
test.py +0 -31

__pycache__/app.cpython-310.pyc ADDED Viewed

Binary file (7.62 kB). View file

{src → algorithm}/__pycache__/demo_watermark.cpython-310.pyc RENAMED Viewed

File without changes

{src → algorithm}/__pycache__/extended_watermark_engine.cpython-310.pyc RENAMED Viewed

Binary files a/src/__pycache__/extended_watermark_engine.cpython-310.pyc and b/algorithm/__pycache__/extended_watermark_engine.cpython-310.pyc differ

{src → algorithm}/__pycache__/extended_watermark_processor.cpython-310.pyc RENAMED Viewed

File without changes

{src → algorithm}/__pycache__/extended_watermark_utils.cpython-310.pyc RENAMED Viewed

File without changes

{src → algorithm}/__pycache__/watermark_demo.cpython-310.pyc RENAMED Viewed

File without changes

{src → algorithm}/__pycache__/watermark_engine.cpython-310.pyc RENAMED Viewed

Binary files a/src/__pycache__/watermark_engine.cpython-310.pyc and b/algorithm/__pycache__/watermark_engine.cpython-310.pyc differ

{src → algorithm}/__pycache__/watermark_processor.cpython-310.pyc RENAMED Viewed

File without changes

{src → algorithm}/__pycache__/watermark_utils.cpython-310.pyc RENAMED Viewed

File without changes

{src → algorithm}/extended_watermark_engine.py RENAMED Viewed

File without changes

{src → algorithm}/watermark_engine.py RENAMED Viewed

File without changes

app.py CHANGED Viewed

@@ -1,37 +1,259 @@
-from argparse import Namespace
-from src.watermark_demo import main
-def get_default_args():
-    """Returns the default arguments as a Namespace object."""
-    default_arg_dict = {
-        'run_gradio': True,
-        'run_extended': False,
-        'demo_public': False,
-        'model_name_or_path': 'bigscience/bloom-560m', #'google/gemma-2-2b-it', #'meta-llama/Meta-Llama-3-8B',
-        'load_fp16': False,
-        'prompt_max_length': None,
-        'max_new_tokens': 200,
-        'generation_seed': 123,
-        'use_sampling': True,
-        'n_beams': 1,
-        'sampling_temp': 0.7,
-        'use_gpu': False,
-        'seeding_scheme': 'simple_1',
-        'gamma': 0.25,
-        'delta': 2.0,
-        'normalizers': '',
-        'skip_repeated_bigrams': False,
-        'ignore_repeated_ngrams': False,
-        'detection_z_threshold': 4.0,
-        'select_green_tokens': True,
-        'skip_model_load': True,
-        'seed_separately': True,
     }
-    args = Namespace()
-    args.__dict__.update(default_arg_dict)
-    return args
 if __name__ == "__main__":
     args = get_default_args()
-    main(args)

+import sys
+from functools import partial
+import gradio as gr
+import torch
+from transformers import (AutoTokenizer,
+                          AutoModelForSeq2SeqLM,
+                          AutoModelForCausalLM,
+                          LogitsProcessorList)
+from algorithm.watermark_engine import LogitsProcessorWithWatermark, WatermarkAnalyzer
+from algorithm.extended_watermark_engine import LogitsProcessorWithWatermarkExtended, WatermarkAnalyzerExtended
+from components.utils import process_args, get_default_prompt, display_prompt, display_results, parse_args, list_format_scores, get_default_args
+def run_gradio(args, model=None, device=None, tokenizer=None):
+    """Define and launch with gradio"""
+    generate_partial = partial(generate, model=model, device=device, tokenizer=tokenizer)
+    detect_partial = partial(analyze, device=device, tokenizer=tokenizer)
+    with gr.Blocks(theme=gr.themes.Soft(primary_hue="orange"), css="footer{display:none !important}") as demo:
+        with gr.Row():
+            with gr.Column(scale=9):
+                gr.Markdown(
+                    """
+                    ## Plagiarism detection for Large Language Models through watermarking
+                    """
+                    )
+            with gr.Column(scale=2):
+                algorithm = gr.Radio(label="Watermark Algorithm", info="which algorithm would you like to use?", choices=["basic", "advance"], value=("advance" if args.run_extended else "basic"))
+        gr.Markdown(f"Language model: {args.model_name_or_path} {'(float16 mode)' if args.load_fp16 else ''}")
+        default_prompt = args.__dict__.pop("default_prompt")
+        session_args = gr.State(value=args)
+        with gr.Tab("Generate and Detect"):
+            with gr.Row():
+                prompt = gr.Textbox(label=f"Prompt", interactive=True,lines=10,max_lines=10, value=default_prompt)
+            with gr.Row():
+                generate_btn = gr.Button("Generate")
+            with gr.Row():
+                with gr.Column(scale=2):
+                    output_without_watermark = gr.Textbox(label="Output Without Watermark", interactive=False,lines=14,max_lines=14)
+                with gr.Column(scale=1):
+                    without_watermark_detection_result = gr.Dataframe(headers=["Metric", "Value"], interactive=False,row_count=7,col_count=2)
+            with gr.Row():
+                with gr.Column(scale=2):
+                    output_with_watermark = gr.Textbox(label="Output With Watermark", interactive=False,lines=14,max_lines=14)
+                with gr.Column(scale=1):
+                    with_watermark_detection_result = gr.Dataframe(headers=["Metric", "Value"],interactive=False,row_count=7,col_count=2)
+            redecoded_input = gr.Textbox(visible=False)
+            truncation_warning = gr.Number(visible=False)
+            def truncate_prompt(redecoded_input, truncation_warning, orig_prompt, args):
+                if truncation_warning:
+                    return redecoded_input + f"\n\n[Prompt was truncated before generation due to length...]", args
+                else:
+                    return orig_prompt, args
+        with gr.Tab("Detector Only"):
+            with gr.Row():
+                with gr.Column(scale=2):
+                    detection_input = gr.Textbox(label="Text to Analyze", interactive=True,lines=14,max_lines=14)
+                with gr.Column(scale=1):
+                    detection_result = gr.Dataframe(headers=["Metric", "Value"], interactive=False,row_count=7,col_count=2)
+            with gr.Row():
+                    detect_btn = gr.Button("Detect")
+        gr.HTML("""
+                <p style="color: gray;">Built with 🤍 by Charles Apochi
+                <br/>
+                <a href="mailto:charlesapochi@gmail.com" style="text-decoration: none; color: orange;">Reach out</a>
+                <p/>
+                """)
+        generate_btn.click(fn=generate_partial, inputs=[prompt,session_args], outputs=[redecoded_input, truncation_warning, output_without_watermark, output_with_watermark,session_args])
+        redecoded_input.change(fn=truncate_prompt, inputs=[redecoded_input,truncation_warning,prompt,session_args], outputs=[prompt,session_args])
+        output_without_watermark.change(fn=detect_partial, inputs=[output_without_watermark,session_args], outputs=[without_watermark_detection_result,session_args])
+        output_with_watermark.change(fn=detect_partial, inputs=[output_with_watermark,session_args], outputs=[with_watermark_detection_result,session_args])
+        detect_btn.click(fn=detect_partial, inputs=[detection_input,session_args], outputs=[detection_result, session_args])
+        # State management logic
+        def update_algorithm(session_state, value):
+            if value == "advance":
+                session_state.run_extended = True
+            elif value == "basic":
+                session_state.run_extended = False
+            return session_state,
+        algorithm.change(update_algorithm,inputs=[session_args, algorithm], outputs=[session_args])
+    demo.launch(share=args.demo_public)
+def load_model(args):
+    """Load and return the model and tokenizer"""
+    args.is_decoder_only_model = True
+    model = AutoModelForCausalLM.from_pretrained(
+                args.model_name_or_path,
+                # device_map="auto",
+                # torch_dtype=torch.float16,
+            )
+    if args.use_gpu:
+        device = "cuda" if torch.cuda.is_available() else "cpu"
+        if args.load_fp16:
+            pass
+        else:
+            model = model.to(device)
+    else:
+        device = "cpu" #"mps" if args.run_extended else "cpu"
+    model.eval()
+    tokenizer = AutoTokenizer.from_pretrained(args.model_name_or_path)
+    return model, tokenizer, device
+def generate(prompt, args, model=None, device=None, tokenizer=None):
+    print(f"Generating with {args}")
+    if args.run_extended:
+        watermark_processor = LogitsProcessorWithWatermarkExtended(vocab=list(tokenizer.get_vocab().values()),
+                                                    gamma=args.gamma,
+                                                    delta=args.delta,
+                                                    seeding_scheme=args.seeding_scheme,
+                                                    select_green_tokens=args.select_green_tokens)
+    else:
+        watermark_processor = LogitsProcessorWithWatermark(vocab=list(tokenizer.get_vocab().values()),
+                                                    gamma=args.gamma,
+                                                    delta=args.delta,
+                                                    seeding_scheme=args.seeding_scheme,
+                                                    select_green_tokens=args.select_green_tokens)
+    gen_kwargs = dict(max_new_tokens=args.max_new_tokens)
+    if args.use_sampling:
+        gen_kwargs.update(dict(
+            do_sample=True,
+            top_k=0,
+            temperature=args.sampling_temp,
+        ))
+    else:
+        gen_kwargs.update(dict(
+            num_beams=args.n_beams,
+        ))
+    generate_without_watermark = partial(
+        model.generate,
+        **gen_kwargs
+    )
+    generate_with_watermark = partial(
+        model.generate,
+        logits_processor=LogitsProcessorList([watermark_processor]),
+        **gen_kwargs
+    )
+    if args.prompt_max_length:
+        pass
+    elif hasattr(model.config,"max_position_embedding"):
+        args.prompt_max_length = model.config.max_position_embeddings-args.max_new_tokens
+    else:
+        args.prompt_max_length = 2048-args.max_new_tokens
+    tokd_input = tokenizer(prompt, return_tensors="pt", add_special_tokens=True, truncation=True, max_length=args.prompt_max_length).to(device)
+    truncation_warning = True if tokd_input["input_ids"].shape[-1] == args.prompt_max_length else False
+    redecoded_input = tokenizer.batch_decode(tokd_input["input_ids"], skip_special_tokens=True)[0]
+    torch.manual_seed(args.generation_seed)
+    output_without_watermark = generate_without_watermark(**tokd_input)
+    if args.seed_separately:
+        torch.manual_seed(args.generation_seed)
+    output_with_watermark = generate_with_watermark(**tokd_input)
+    if args.is_decoder_only_model:
+        # need to isolate the newly generated tokens
+        output_without_watermark = output_without_watermark[:,tokd_input["input_ids"].shape[-1]:]
+        output_with_watermark = output_with_watermark[:,tokd_input["input_ids"].shape[-1]:]
+    decoded_output_without_watermark = tokenizer.batch_decode(output_without_watermark, skip_special_tokens=True)[0]
+    decoded_output_with_watermark = tokenizer.batch_decode(output_with_watermark, skip_special_tokens=True)[0]
+    return (redecoded_input,
+            int(truncation_warning),
+            decoded_output_without_watermark,
+            decoded_output_with_watermark,
+            args)
+            # decoded_output_with_watermark)
+def analyze(input_text, args, device=None, tokenizer=None):
+    detector_args = {
+        "vocab": list(tokenizer.get_vocab().values()),
+        "gamma": args.gamma,
+        "delta": args.delta,
+        "seeding_scheme": args.seeding_scheme,
+        "select_green_tokens": args.select_green_tokens,
+        "device": device,
+        "tokenizer": tokenizer,
+        "z_threshold": args.detection_z_threshold,
+        "normalizers": args.normalizers,
     }
+    if args.run_extended:
+        detector_args["ignore_repeated_ngrams"] = args.ignore_repeated_ngrams
+    else:
+        detector_args["skip_repeated_bigrams"] = args.skip_repeated_bigrams
+    if args.run_extended:
+        watermark_detector = WatermarkAnalyzerExtended(**detector_args)
+    else:
+        watermark_detector = WatermarkAnalyzer(**detector_args)
+    if args.run_extended:
+        score_dict = watermark_detector.analyze(input_text)
+        output = list_format_scores(score_dict, watermark_detector.z_threshold)
+    else:
+        if len(input_text)-1 > watermark_detector.min_prefix_len:
+            score_dict = watermark_detector.analyze(input_text)
+            # output = str_format_scores(score_dict, watermark_detector.z_threshold)
+            output = list_format_scores(score_dict, watermark_detector.z_threshold)
+        else:
+            # output = (f"Error: string not long enough to compute watermark presence.")
+            output = [["Error","string too short to compute metrics"]]
+            output += [["",""] for _ in range(6)]
+    return output, args
 if __name__ == "__main__":
     args = get_default_args()
+    # args = process_args(args)
+    input_text = get_default_prompt()
+    args.default_prompt = input_text
+    if not args.skip_model_load:
+        model, tokenizer, device = load_model(args)
+    else:
+        model, tokenizer, device = None, None, None
+    if not args.skip_model_load:
+        display_prompt(input_text)
+        _, _, decoded_output_without_watermark, decoded_output_with_watermark, _ = generate(
+            input_text, args, model=model, device=device, tokenizer=tokenizer
+        )
+        without_watermark_detection_result = analyze(
+            decoded_output_without_watermark, args, device=device, tokenizer=tokenizer
+        )
+        with_watermark_detection_result = analyze(
+            decoded_output_with_watermark, args, device=device, tokenizer=tokenizer
+        )
+        display_results(decoded_output_without_watermark, without_watermark_detection_result, args, with_watermark=False)
+        display_results(decoded_output_with_watermark, with_watermark_detection_result, args, with_watermark=True)
+    if args.run_gradio:
+        run_gradio(args, model=model, tokenizer=tokenizer, device=device)

components/__pycache__/homoglyphs.cpython-310.pyc CHANGED Viewed

Binary files a/components/__pycache__/homoglyphs.cpython-310.pyc and b/components/__pycache__/homoglyphs.cpython-310.pyc differ

components/__pycache__/normalizers.cpython-310.pyc CHANGED Viewed

Binary files a/components/__pycache__/normalizers.cpython-310.pyc and b/components/__pycache__/normalizers.cpython-310.pyc differ

components/__pycache__/prf_schemes.cpython-310.pyc CHANGED Viewed

Binary files a/components/__pycache__/prf_schemes.cpython-310.pyc and b/components/__pycache__/prf_schemes.cpython-310.pyc differ

components/__pycache__/utils.cpython-310.pyc CHANGED Viewed

Binary files a/components/__pycache__/utils.cpython-310.pyc and b/components/__pycache__/utils.cpython-310.pyc differ

{data → components/data}/__init__.py RENAMED Viewed

File without changes

{data → components/data}/categories.json RENAMED Viewed

File without changes

{data → components/data}/confusables.json RENAMED Viewed

File without changes

{data → components/data}/languages.json RENAMED Viewed

File without changes

components/utils.py CHANGED Viewed

@@ -1,6 +1,38 @@
 from pprint import pprint
 import argparse
 from itertools import chain, tee
 def process_args(args):
     """Process and normalize command-line arguments."""

 from pprint import pprint
 import argparse
 from itertools import chain, tee
+from argparse import Namespace
+def get_default_args():
+    """Returns the default arguments as a Namespace object."""
+    default_arg_dict = {
+        'run_gradio': True,
+        'run_extended': True,
+        'demo_public': False,
+        'model_name_or_path': 'google/gemma-2-2b-it', #'bigscience/bloom-560m', #'meta-llama/Meta-Llama-3-8B',
+        'load_fp16': False,
+        'prompt_max_length': None,
+        'max_new_tokens': 200,
+        'generation_seed': 123,
+        'use_sampling': True,
+        'n_beams': 1,
+        'sampling_temp': 0.7,
+        'use_gpu': False,
+        'seeding_scheme': 'simple_1',
+        'gamma': 0.25,
+        'delta': 2.0,
+        'normalizers': '',
+        'skip_repeated_bigrams': False,
+        'ignore_repeated_ngrams': False,
+        'detection_z_threshold': 4.0,
+        'select_green_tokens': True,
+        'skip_model_load': False,
+        'seed_separately': True,
+    }
+    args = Namespace()
+    args.__dict__.update(default_arg_dict)
+    return args
 def process_args(args):
     """Process and normalize command-line arguments."""

src/watermark_demo.py DELETED Viewed

@@ -1,291 +0,0 @@
-from distutils.command.config import config
-import sys
-from functools import partial
-import gradio as gr
-import torch
-from transformers import (AutoTokenizer,
-                          AutoModelForSeq2SeqLM,
-                          AutoModelForCausalLM,
-                          LogitsProcessorList)
-from src.watermark_engine import LogitsProcessorWithWatermark, WatermarkAnalyzer
-from src.extended_watermark_engine import LogitsProcessorWithWatermarkExtended, WatermarkAnalyzerExtended
-from components.utils import process_args, get_default_prompt, display_prompt, display_results, parse_args, list_format_scores
-def run_gradio(args, model=None, device=None, tokenizer=None):
-    """Define and launch with gradio"""
-    generate_partial = partial(generate, model=model, device=device, tokenizer=tokenizer)
-    detect_partial = partial(analyze, device=device, tokenizer=tokenizer)
-    with gr.Blocks(theme=gr.themes.Soft(primary_hue="orange"), css="footer{display:none !important}") as demo:
-        with gr.Row():
-            with gr.Column(scale=9):
-                gr.Markdown(
-                    """
-                    ## Plagiarism detection for Large Language Models through watermarking
-                    """
-                    )
-            with gr.Column(scale=2):
-                algorithm = gr.Radio(label="Watermark Algorithm", info="which algorithm would you like to use?", choices=["basic", "advance"], value=("advance" if args.run_extended else "basic"))
-        default_prompt = args.__dict__.pop("default_prompt")
-        session_args = gr.State(value=args)
-        initial_args = {
-            "model_name_or_path": args.model_name_or_path,
-            "load_fp16": False
-        }
-        session_md = gr.State(value=initial_args)
-        def update_display(args):
-            return f"Language model: {args['model_name_or_path']} {'(float16 mode)' if args['load_fp16'] else ''}"
-        display_md = gr.Markdown(update_display(initial_args))
-        # gr.Markdown(f"Language model: {args.model_name_or_path} {'(float16 mode)' if args.load_fp16 else ''}")
-        with gr.Tab("Generate and Detect"):
-            with gr.Row():
-                prompt = gr.Textbox(label=f"Prompt", interactive=True,lines=10,max_lines=10, value=default_prompt)
-            with gr.Row():
-                generate_btn = gr.Button("Generate")
-            with gr.Row():
-                with gr.Column(scale=2):
-                    output_without_watermark = gr.Textbox(label="Output Without Watermark", interactive=False,lines=14,max_lines=14)
-                with gr.Column(scale=1):
-                    without_watermark_detection_result = gr.Dataframe(headers=["Metric", "Value"], interactive=False,row_count=7,col_count=2)
-            with gr.Row():
-                with gr.Column(scale=2):
-                    output_with_watermark = gr.Textbox(label="Output With Watermark", interactive=False,lines=14,max_lines=14)
-                with gr.Column(scale=1):
-                    with_watermark_detection_result = gr.Dataframe(headers=["Metric", "Value"],interactive=False,row_count=7,col_count=2)
-            redecoded_input = gr.Textbox(visible=False)
-            truncation_warning = gr.Number(visible=False)
-            def truncate_prompt(redecoded_input, truncation_warning, orig_prompt, args):
-                if truncation_warning:
-                    return redecoded_input + f"\n\n[Prompt was truncated before generation due to length...]", args
-                else:
-                    return orig_prompt, args
-        with gr.Tab("Detector Only"):
-            with gr.Row():
-                with gr.Column(scale=2):
-                    detection_input = gr.Textbox(label="Text to Analyze", interactive=True,lines=14,max_lines=14)
-                with gr.Column(scale=1):
-                    detection_result = gr.Dataframe(headers=["Metric", "Value"], interactive=False,row_count=7,col_count=2)
-            with gr.Row():
-                    detect_btn = gr.Button("Detect")
-        gr.HTML("""
-                <p style="color: gray;">Built with 🤍 by Charles Apochi
-                <br/>
-                <a href="mailto:charlesapochi@gmail.com" style="text-decoration: none; color: orange;">Reach out</a>
-                <p/>
-                """)
-        generate_btn.click(fn=generate_partial, inputs=[prompt,session_args], outputs=[redecoded_input, truncation_warning, output_without_watermark, output_with_watermark,session_args])
-        redecoded_input.change(fn=truncate_prompt, inputs=[redecoded_input,truncation_warning,prompt,session_args], outputs=[prompt,session_args])
-        output_without_watermark.change(fn=detect_partial, inputs=[output_without_watermark,session_args], outputs=[without_watermark_detection_result,session_args])
-        output_with_watermark.change(fn=detect_partial, inputs=[output_with_watermark,session_args], outputs=[with_watermark_detection_result,session_args])
-        detect_btn.click(fn=detect_partial, inputs=[detection_input,session_args], outputs=[detection_result, session_args])
-        # State management logic
-        def update_algorithm(session_state, session_md, value):
-            new_md = session_md.copy()
-            if value == "advance":
-                session_state.run_extended = True
-                session_state.model_name_or_path = 'google/gemma-2-2b-it'
-                new_md['model_name_or_path'] = 'google/gemma-2-2b-it'
-            elif value == "basic":
-                session_state.run_extended = False
-                session_state.model_name_or_path = 'bigscience/bloom-560m'
-                new_md['model_name_or_path'] = 'bigscience/bloom-560m'
-            return session_state, new_md, update_display(new_md)
-        algorithm.change(update_algorithm,inputs=[session_args, session_md, algorithm], outputs=[session_args, session_md, display_md])
-    demo.launch(share=args.demo_public)
-def load_model(args):
-    """Load and return the model and tokenizer"""
-    args.is_decoder_only_model = True
-    if args.run_extended:
-        model = AutoModelForCausalLM.from_pretrained(
-                args.model_name_or_path,
-                device_map="auto",
-                torch_dtype=torch.float16,
-            )
-    else:
-        model = AutoModelForCausalLM.from_pretrained(args.model_name_or_path)
-    if args.use_gpu:
-        device = "cuda" if torch.cuda.is_available() else "cpu"
-        if args.load_fp16:
-            pass
-        else:
-            model = model.to(device)
-    else:
-        device = "mps" if args.run_extended else "cpu"
-    model.eval()
-    tokenizer = AutoTokenizer.from_pretrained(args.model_name_or_path)
-    return model, tokenizer, device
-def generate(prompt, args, model=None, device=None, tokenizer=None):
-    print(f"Generating with {args}")
-    model, tokenizer, device = load_model(args)
-    if args.run_extended:
-        watermark_processor = LogitsProcessorWithWatermarkExtended(vocab=list(tokenizer.get_vocab().values()),
-                                                    gamma=args.gamma,
-                                                    delta=args.delta,
-                                                    seeding_scheme=args.seeding_scheme,
-                                                    select_green_tokens=args.select_green_tokens)
-    else:
-        watermark_processor = LogitsProcessorWithWatermark(vocab=list(tokenizer.get_vocab().values()),
-                                                    gamma=args.gamma,
-                                                    delta=args.delta,
-                                                    seeding_scheme=args.seeding_scheme,
-                                                    select_green_tokens=args.select_green_tokens)
-    gen_kwargs = dict(max_new_tokens=args.max_new_tokens)
-    if args.use_sampling:
-        gen_kwargs.update(dict(
-            do_sample=True,
-            top_k=0,
-            temperature=args.sampling_temp,
-        ))
-    else:
-        gen_kwargs.update(dict(
-            num_beams=args.n_beams,
-        ))
-    generate_without_watermark = partial(
-        model.generate,
-        **gen_kwargs
-    )
-    generate_with_watermark = partial(
-        model.generate,
-        logits_processor=LogitsProcessorList([watermark_processor]),
-        **gen_kwargs
-    )
-    if args.prompt_max_length:
-        pass
-    elif hasattr(model.config,"max_position_embedding"):
-        args.prompt_max_length = model.config.max_position_embeddings-args.max_new_tokens
-    else:
-        args.prompt_max_length = 2048-args.max_new_tokens
-    tokd_input = tokenizer(prompt, return_tensors="pt", add_special_tokens=True, truncation=True, max_length=args.prompt_max_length).to(device)
-    truncation_warning = True if tokd_input["input_ids"].shape[-1] == args.prompt_max_length else False
-    redecoded_input = tokenizer.batch_decode(tokd_input["input_ids"], skip_special_tokens=True)[0]
-    torch.manual_seed(args.generation_seed)
-    output_without_watermark = generate_without_watermark(**tokd_input)
-    if args.seed_separately:
-        torch.manual_seed(args.generation_seed)
-    output_with_watermark = generate_with_watermark(**tokd_input)
-    if args.is_decoder_only_model:
-        # need to isolate the newly generated tokens
-        output_without_watermark = output_without_watermark[:,tokd_input["input_ids"].shape[-1]:]
-        output_with_watermark = output_with_watermark[:,tokd_input["input_ids"].shape[-1]:]
-    decoded_output_without_watermark = tokenizer.batch_decode(output_without_watermark, skip_special_tokens=True)[0]
-    decoded_output_with_watermark = tokenizer.batch_decode(output_with_watermark, skip_special_tokens=True)[0]
-    return (redecoded_input,
-            int(truncation_warning),
-            decoded_output_without_watermark,
-            decoded_output_with_watermark,
-            args)
-            # decoded_output_with_watermark)
-def analyze(input_text, args, device=None, tokenizer=None):
-    tokenizer = AutoTokenizer.from_pretrained(args.model_name_or_path)
-    device = "mps" if args.run_extended else "cpu"
-    detector_args = {
-        "vocab": list(tokenizer.get_vocab().values()),
-        "gamma": args.gamma,
-        "delta": args.delta,
-        "seeding_scheme": args.seeding_scheme,
-        "select_green_tokens": args.select_green_tokens,
-        "device": device,
-        "tokenizer": tokenizer,
-        "z_threshold": args.detection_z_threshold,
-        "normalizers": args.normalizers,
-    }
-    if args.run_extended:
-        detector_args["ignore_repeated_ngrams"] = args.ignore_repeated_ngrams
-    else:
-        detector_args["skip_repeated_bigrams"] = args.skip_repeated_bigrams
-    if args.run_extended:
-        watermark_detector = WatermarkAnalyzerExtended(**detector_args)
-    else:
-        watermark_detector = WatermarkAnalyzer(**detector_args)
-    if args.run_extended:
-        score_dict = watermark_detector.analyze(input_text)
-        output = list_format_scores(score_dict, watermark_detector.z_threshold)
-    else:
-        if len(input_text)-1 > watermark_detector.min_prefix_len:
-            score_dict = watermark_detector.analyze(input_text)
-            # output = str_format_scores(score_dict, watermark_detector.z_threshold)
-            output = list_format_scores(score_dict, watermark_detector.z_threshold)
-        else:
-            # output = (f"Error: string not long enough to compute watermark presence.")
-            output = [["Error","string too short to compute metrics"]]
-            output += [["",""] for _ in range(6)]
-    return output, args
-def main(args):
-    """Run the main script for generation and detection"""
-    args = process_args(args)
-    input_text = get_default_prompt()
-    args.default_prompt = input_text
-    if not args.skip_model_load:
-        model, tokenizer, device = load_model(args)
-    else:
-        model, tokenizer, device = None, None, None
-    if not args.skip_model_load:
-        display_prompt(input_text)
-        _, _, decoded_output_without_watermark, decoded_output_with_watermark, _ = generate(
-            input_text, args, model=model, device=device, tokenizer=tokenizer
-        )
-        without_watermark_detection_result = analyze(
-            decoded_output_without_watermark, args, device=device, tokenizer=tokenizer
-        )
-        with_watermark_detection_result = analyze(
-            decoded_output_with_watermark, args, device=device, tokenizer=tokenizer
-        )
-        display_results(decoded_output_without_watermark, without_watermark_detection_result, args, with_watermark=False)
-        display_results(decoded_output_with_watermark, with_watermark_detection_result, args, with_watermark=True)
-    if args.run_gradio:
-        run_gradio(args, model=model, tokenizer=tokenizer, device=device)
-    return
-if __name__ == "__main__":
-    args = parse_args()
-    main(args)

test.py DELETED Viewed

@@ -1,31 +0,0 @@
-import torch
-from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
-tokenizer = AutoTokenizer.from_pretrained("google/gemma-2-2b-it")
-model = AutoModelForCausalLM.from_pretrained(
-    "google/gemma-2-2b-it",
-    device_map="auto",
-    torch_dtype=torch.float16,
-)
-input_text = "Write me a poem about Machine Learning."
-input_ids = tokenizer(input_text, return_tensors="pt").to("mps")
-outputs = model.generate(**input_ids, max_new_tokens=32)
-print(tokenizer.decode(outputs[0]))
-pipe = pipeline(
-    "text-generation",
-    model= "google/gemma-2-2b-it",
-    model_kwargs={"torch_dtype": torch.float16},
-    device="mps",  # replace with "mps" to run on a Mac device
-)
-messages = [
-    {"role": "user", "content": "Who are you? Please, answer in pirate-speak."},
-]
-outputs = pipe(messages, max_new_tokens=256)
-assistant_response = outputs[0]["generated_text"][-1]["content"].strip()
-print(assistant_response)
-# Ahoy, matey! I be Gemma, a digital scallywag, a language-slingin' parrot of the digital seas. I be here to help ye with yer wordy woes, answer yer questions, and spin ye yarns of the digital world.  So, what be yer pleasure, eh? 🦜